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仙 入 陈 软件 设计 之 
思想 与 方法 


张 邦 本 编著 
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内 容 简 介 


本 书 从 教学 的 角度 出 发 ,全 面 讨 论 了 嵌入 式 软 件 设 计 的 思想 与 方法 。 在 编排 上 循序 渐进 ,从 基础 准备 ,到 
驱动 模型 ,再 深入 到 整个 系统 及 系统 的 构建 。 在 讲解 上 通过 建立 模型 来 帮助 读者 系统 掌握 碰 人 式 软件 设计 的 
普遍 原理 与 编程 接口 。 内 容 包括 :高 效 、 稳 定 和 规范 的 程序 基础 ,多 任务 环境 ,IO 系统 的 内 部 结构 ,驱动 模 
型 ,BSP 设计 要 素 ,嵌入 式 软件 设计 的 经 验 技 巧 ;在 硬件 基础 方面 讨论 了 总 线 与 设备 的 模型 ,基于 MIPS 和 
ARM SocCc 在 多 个 系统 平台 VxWorks,Linux 及 WinCE 下 的 系统 资源 的 操控 。 

本 书 可 作为 在 校 学 生 学 习 艇 人 式 软 件 设 计 原 理 的 教学 参考 用 书 , 也 可 作为 欲 人 式 软件 开发 工程 人 员 深 
人 掌握 系统 软件 设计 的 指南 ,以 及 入 人 式 软件 培训 的 参考 教材 。 
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硬件 技术 的 飞速 发 展 ,使 硬件 的 性 能 显著 提高 ,并 且 成 本 极速 降低 。 微 处 理 器 已 经 深入 到 
人 们 生活 和 生产 的 各 个 领域 ,各 种 产品 和 设备 都 逐渐 增加 了 复杂 的 智能 化 功能 ,使 得 消费 类 电 
子 产品 .个 人 媒体 产品 .个 人 数字 助理 以 及 工业 控制 等 领域 得 以 快速 发 展 。 随 着 这 些 产品 的 高 
度 智 能 化 和 复杂 化 ,嵌入 式 软件 的 需求 得 到 迅猛 发 展 。 从 单片机 的 控制 软件 ,到 功能 强大 的 多 
任务 实时 操作 系统 平台 ,产品 的 智能 化 程度 越 来 越 高 , 易 用 性 越 来 越 好 ,嵌入 式 软件 及 其 应 用 
领域 越 来 越 广泛 ,从 而 对 内 入 式 软 件 的 要 求 也 变 得 越 来 越 复杂 。 

本 书 旨 在 为 内 人 式 软 件 开发 爱好 者 提供 一 个 人 门 的 引导 。 面 对 复杂 的 做 和 人 式 系 统 软件 ， 
作为 一 位 初学 者 ,如何 清 楚 把 握 戏 人 式 软件 的 设计 对 象 与 目标 ,如 何 寻找 一 个 很 好 的 切 人 点 ， 
尽快 参与 到 从 人 式 软件 的 设计 当中 ,对 于 这 些 问 题 ,希望 通过 本 书 的 讲解 ,能 够 为 读者 提供 一 
些 有 益 的 启示 。 

笔者 多 年 来 一 直 在 散人 式 软 件 领域 从 事实 际 项 目的 开发 工作 ,出 于 对 软件 设计 的 执著 与 
偏爱 ,笔者 把 这 些 年 从 事 能 入 式 软件 设计 的 经 验 点 滴 整 理 出 来 ,与 更 多 的 僚 人 式 软件 设计 爱好 
者 分 享 。 目 前 ,尽管 介绍 嵌 人 式 软件 设计 方面 的 书籍 较 多 ,但 全 面 、 系 统 地 讨论 如 何 从 头 开始 
设计 拱 入 式 系统 软件 的 书籍 却 很 少 。 很 多 岩 和 人 式 软件 设 计 方 面 的 书籍 都 是 一 些 诸 如 百科 全 书 
的 参考 手册 ,由 于 体系 过 于 庞大 ,或 讨论 过 于 专业 ,初学 者 很 难 在 短 时 间 内 把 握 其 中 有 用 的 部 
分 ,因而 更 难 将 庞大 体系 里 各 书籍 中 的 精华 串 到 一 起 ,而 本 书 正 是 这 些 书籍 精华 的 一 种 提炼 。 
本 书 以 讲述 的 方式 ,深入 剖析 嵌入 式 系统 软件 设计 的 各 个 层面 ,以 及 设计 实践 中 的 各 个 关键 之 
事 , 以 帮助 读者 轻松 地 领会 谋 人 式 软 件 设计 的 方法 ,掌握 戏 人 式 软 件 的 核心 架构 。 

书 中 通过 对 嵌 人 式 系统 的 分 解 ,重点 讲述 嵌 人 式 系统 软件 的 层次 结构 。 通 过 对 目前 多 个 
主流 系统 (VxWorks,Linux, WinCE) 内 核 进行 深入 浅 出 的 剖析 与 对 比 , 帮 助 读 者 建立 起 正确 
的 驱动 设计 模型 ;通过 对 不 同 硬件 平台 (MIPS,ARM) 所 开发 的 板 级 支持 包 (BSP) 的 深入 讨 
论 ,帮助 读者 掌握 硬件 适 配 层 (OAL) 设 计 的 核心 概念 ,使 读者 清楚 理解 系统 环境 的 上 下 文 , 前 
因 后 果 , 从 而 更 好 地 把 握 各 个 软件 模块 设计 的 分 界 与 接口 ,把握 设 计 的 对 象 与 目标 ,在 设计 中 
做 到 心中 有 数 , 目 标明 确 , 从 而 更 好 、 更 快 地 解决 问题 。 

要 想 成 为 一 名 成 功 的 从 入 式 软 件 程序 员 ,程序 的 设计 能 力 是 首要 的 技能 。 如 何 打 好 程序 
设计 基础 ,如 何 编写 工程 化 的 程序 ,如 何在 设计 中 与 团队 协作 开发 .在 后 续 开 发 中 有 效 地 升级 


与 维护 ,如何 编 写 规 范 的 文档 等 ,这 些 都 是 工程 化 软件 设计 中 非常 关键 的 环节 ,本 书 花 费 大 量 
篇 幅 进 行 介 绍 ,以 帮助 读者 提高 程序 设计 能 力 。 

书 中 从 各 种 复杂 的 软件 系统 中 抽象 出 驱动 模型 和 板 级 支持 包 的 设计 模型 ;对 于 硬件 基础 ， 
也 通过 模型 化 的 方法 讲述 了 总 线 的 一 般 概念 与 作用 ,抽象 出 输入 /输出 设备 的 模型 。 通 过 这 些 
模型 化 的 讲解 ,便于 读者 掌握 内 人 式 软件 设计 的 目标 与 内 容 , 从 而 提高 软件 设计 能 力 。 

1. 读者 对 象 

本 书 的 读者 对 象 为 能 和 人 式 程 序 设计 的 初学 者 ,本 书 也 可 作为 大 中 专 学 生 学 习 骨 人 式 软件 
设计 的 人 门 参考 。 对 于 那些 已 从 事 傣 人 式 软件 设计 一 段 时 间 , 但 是 在 设计 实践 中 感觉 力 不 从 


， 心 ,需要 全 面 掌握 艇 人 式 软件 设计 内 容 与 目标 ,掌握 一 些 新 的 技巧 与 方法 的 读者 ,相信 本 书 将 


会 起 到 良师益友 的 作用 。 

本 书 也 可 以 作为 嵌入 式 软件 培训 的 教材 。 

2， 题 材 与 组 织 

本 书 共 分 为 四 篇 ,其 中 第 一 篇 着 重 讨论 作为 一 名 优秀 的 伐 入 式 软件 设计 人 员 所 必 备 的 知 
识 和 技能 。 需 要 说 明 的 是 :限于 时 间 和 精力 ,本 书 没 能 全 面 品 括 岩 人 式 软件 设计 的 所 有 知识 点 
和 技术 面 , 但 希望 本 书 能 让 读者 掌握 基本 的 框架 ,使 读者 在 今后 的 学 习 和 工作 实践 中 ,更 好 地 
结合 优秀 读物 和 参考 资料 ,不 断 学习 和 实践 ,从 而 提高 自身 的 软件 设计 能 力 和 水 平 。 

(1) 基础 方法 篇 

第 一 篇 包含 三 部 分 内 容 :程序 基 础 、 多 任务 系统 和 硬件 基础 。 要 想 成 为 一 名 优秀 的 戏 人 式 
软件 设计 人 员 ,概括 地 讲 , 需 要 熟练 掌握 以 下 4 方面 的 知识 技能 : 

钥 程序 基础 ; 

国 操作 系统 原理 ; 

国 硬件 知识 ; 

国 调试 能 力 与 学 习 能 力 。 

在 此 篇 中 ,简要 分 析 了 典 入 式 软 件 设计 的 特殊 性 及 其 要 求 , 讨 论 接 口 、 代 码 及 文档 的 要 求 
规范 ,通过 各 种 例证 ,以点带面 ,引导 读者 一 步 步 设 计 出 高 性 能 、 稳 定 可 靠 、. 维 护 性 强 和 可 读 性 
好 的 岩 人 式 程 序 。 

在 “多 任务 操作 系统 ”一 章 中 ,着重 讨论 了 与 散人 式 软 件 设 计 相关 的 多 任务 环境 .模块 间 同 
步 与 通信 协同 .驱动 设计 以 及 动态 库 设 计 中 可 重 人 性 等 问题 。 为 了 避免 重复 ,与 驱动 设计 密切 
相关 的 IO 系统 则 放 在 驱动 模型 一 章 中 详细 讨论 。 与 其 他 书籍 不 同 , 本 书 没有 展开 那些 与 邮 
入 式 软件 设计 关系 不 大 的 内 核 机 制 ,例如 进度 调度 .内 存 管 理 的 实现 等 ,除非 在 涉及 操作 系统 
核心 开发 时 才 有 所 展开 。 在 讨论 多 任务 话题 时 ,本 书 也 是 从 程序 实现 的 角度 来 分 析 系 统 需求 
以 及 软件 的 实现 ,而 不 单 从 理论 上 加 以 分 析 。 去 除了 那些 既 复杂 ,又 与 OEM 硬件 平台 开发 不 
相关 的 内 容 , 增 加 了 实践 中 的 理论 相关 性 ,使 本 书 非 常 简明 、 实 用 。 


前 


在 “硬件 基础 ”一 章 中 简要 地 讨论 了 MIPS 和 ARM 的 汇编 程序 设计 基础 ,以 及 与 板 级 支 
持 包 (BSP) 开 发 紧密 相关 的 CPU 中 断 与 异常 的 处 理 。 通 过 对 MIPS 与 ARM 两 种 RISC 架构 
内 部 机 制 的 比较 ,帮助 读者 理解 硬件 的 工作 机 制 , 以 及 软件 与 硬件 交互 所 要 实现 的 任务 。 

除 此 之 外 ,还 简要 地 分 析 作 为 硬件 设备 基础 的 总 线 模型 ,并 通过 两 种 常用 的 总 线 下 C 和 
PCI 的 相关 例子 ,帮助 读者 学 习 和 理解 总 线 协 议 。 总 线 是 设备 的 命脉 ,设备 通过 总 线 传达 信 
息 , 交 互 数 据 。 理 解 了 这 些 原理 和 硬件 的 工作 行为 后 ,就 能 做 到 在 驱动 实现 和 板 级 支持 包 的 开 
发 中 得 心 应 手 , 游 了 有余 。 

对 于 舱 和 人 式 软 件 开发 的 工具 包 , 以 及 一 些 软件 的 调试 技能 和 技巧 ,由 于 篇 幅 所 限 ,在 此 未 
作 讨论 ,将 在 后 续 的 版 本 中 不 断 丰 富 和 完善 。 

(2) 驱动 模型 篇 

在 第 二 篇 中 深入 讨论 了 藤 和 人 式 软件 设计 中 重要 任务 之 一 的 驱动 程序 的 模型 架构 。 从 抽 
象 一般 的 概念 到 多 个 实际 嵌 人 式 操 作 系统 的 驱动 架构 的 分 析 ,读者 可 以 深入 学 习 驱 动 设计 的 
层次 模型 ,清晰 地 掌握 驱动 设计 过 程 中 各 种 接口 及 其 相互 关系 ,从 而 准确 地 把 握 各 个 模块 的 设 
计 任 务 。 

第 二 篇 从 第 4 章 到 第 7 章 , 共 分 4 章 , 第 4 章 讨 论 驱动 的 通用 模型 ,从 驱动 的 层次 结构 , 驱 
动 与 应 用 及 与 系统 的 交互 ,驱动 种 类 ,驱动 的 系统 初始 化 、 挂 接 以 及 内 部 实现 例 程 的 各 种 接口 
来 讨论 驱动 设计 的 一 般 概 念 。 

后 面 三 章 分 别 就 前 一 章 所 讨论 的 一 般 概 念 ,结合 VxWorks,Linux 和 WinCE 等 实际 操作 
系统 ,深入 分 析 IO 系统 的 内 部 运行 机 制 、. 内 部 数据 结构 .应 用 程序 打开 .关闭 设备 文件 以 及 
进行 各 种 读 、 写 .控制 操作 所 关联 的 驱动 实现 ,并 通过 一 个 简单 的 例子 ,介绍 如 何 编写 一 个 完 
整 、 复 杂 的 驱动 程序 。 

(3) BSP/OAL 篇 

第 三 篇 是 板 级 支持 包 (BSP) 的 开发 。 板 级 支持 包 的 开发 比 驱 动 的 开发 更 复杂 ,涉及 的 问 
题 更 多 ,要求 的 知识 更 专业 。 从 编排 上 将 这 一 更 复杂 的 系统 驱动 放 在 第 三 部 分 ,体现 了 由 易 到 
难 的 编排 方式 。 本 篇 从 中 断 .异常 .硬件 IO 访问 等 核心 要 素 ,讲解 如 何 设计 硬件 适 配 层 的 支 
持 软 件 包 ,详细 讨论 了 中 断 处 理 的 完整 架构 ,异常 处 理 的 向 量 表 安装 和 分 发 机 理 , 并 通过 大 量 
例子 说 明 如 何 进行 实际 代码 实现 。 

(4) 扩展 篇 

作为 本 书 的 结尾 篇 “扩展 篇 ”, 进 一 步 介 绍 了 作者 在 嵌入 式 软件 设计 中 的 一 些 心 得 体会 。 
另外 ,再 次 讨论 作为 软件 表现 形式 一 一 “程序 ”的 内 部 结构 。 深 入 理解 程序 的 内 部 结构 是 开发 
板 级 支持 包 以 及 开发 系统 程序 的 核心 基础 。 

本 书 虽 然 在 最 后 一 章 才 提 到 思想 ,事实 上 ,前 面 的 章节 都 通过 嵌 人 式 软件 开发 的 实践 阐述 
了 嵌入 式 软件 设计 的 方法 与 设计 理念 ,从 而 将 散人 式 软 件 的 设计 思想 贯穿 于 全 书 之 中 。 

本 书 通过 实际 例子 ,从 驱动 模型 和 操作 系统 底层 设计 模型 来 讲述 散人 式 软件 设计 的 一 般 
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原理 与 方法 。 在 体系 的 安排 上 也 采用 循序 渐进 .由 简 到 难 的 方式 。 虽 然 本 书 不 能 作为 某 个 平 
台 开 发 的 完整 参考 ,但 是 对 每 个 问题 的 讨论 ,都 力求 深入 .完整 。 

3. 如 何 理解 本 书 内 容 

对 于 驱动 的 开发 ,本 书 不 是 针对 一 些 特定 设备 讨论 具体 的 驱动 编程 开发 ,而 是 讲述 驱动 开 
发 必 备 的 知识 与 技能 ,其 逻辑 关系 如 图 0-1 所 示 。 


图 0-1 设备 驱动 开发 的 各 识 与 技能 
同样 ,对 于 BSP, 本 书 也 讲述 了 所 有 必需 的 知识 与 技能 ,其 逻辑 关系 如 图 0- 2 所 示 。 


图 0-2 BSP 开发 的 知识 与 技能 
这 些 内 容 的 选材 与 组 织 编排 体现 了 本 书 “ 思 想 与 方法 ”的 宗旨 。 本 书 详细 地 讨论 所 有 这 些 
相关 知识 与 技能 的 各 个 方面 ,着 重 从 能 力 方 面 培养 读者 设计 岩 人 式 系 统 软件 的 各 个 部 件 乃 至 
整个 散人 式 产 品 。 


为 何 要 谈 思 想 与 方法 ? 生活 中 这 样 的 例证 很 多 , 若 做 一 件 事 情 不 得 法 或 不 得 要 领 , 往 往 收 
效 甚 微 。 和 能 人 式 软 件 是 一 项 复杂 的 设计 工作 ,如 果 方 法 不 当 , 往 往 顾此失彼 ,或 只 见 树 木 , 不 见 
森林 。 本 书 之 所 以 谓 之 为 思想 与 方法 ,是 因为 从 一 个 程序 员 的 角度 来 看 问题 ,力求 讲 清楚 问题 
的 实质 ,从 整体 到 局 部 ,从 个 性 到 共性 ,从 理论 到 实践 ,都 有 比较 深入 的 讨论 。 

历史 上 曾经 有 一 位 射影 几何 学 大 师 帕 斯 卡 , 在 研究 圈 圈 棒 棒 的 过 程 中 ,于 16 岁 就 发 表 了 
射影 几何 中 最 重要 的 定理 之 一 一 一 帕斯卡 定理 。 以 下 摘 引 一 个 “ 圈 圈 棒 棒 非 欧 几 何 ” 的 典故 
(http://www. 6edu, org. cn/news/ReadNews. asp? NewsID 王 6518) ,以 提起 读者 兴趣 。 

帕斯卡 的 神秘 六 边 形 

差不多 与 笛 沙 格 同时 ,对 射影 几何 作出 重要 贡献 的 是 数学 天 才 帕 斯 卡 。1623 年 ,他 出 生 
在 法 国 克 勒 蕊 ,小 时 候 虽 体 弱 多 病 , 却 很 早 就 显 出 非凡 的 数学 才能 。 父 亲 不 让 小 帕斯卡 过 早 接 
触 数学 , 怕 过 度 紧 张 的 思考 损害 他 的 健康 ,将 所 有 的 数学 书籍 都 藏 起 来 。 

严格 的 禁令 反而 激发 了 小 帕斯卡 的 好 奇 心 ,12 岁 时 他 问 父 亲 :“ 几 何 学 究竟 是 什么 ?2 

父亲 回答 说 :几何 学 是 一 门 提供 正确 作 图 ,并 找 出 各 图 形 之 间 存 在 的 关系 的 学 科 。? 说 完 ， 
马上 强调 以 后 再 不 能 谈论 数学 问题 了 。 

然而 帕斯卡 听 了 父亲 的 谈话 后 ,激动 的 心情 不 能 自己 。 他 自立 定义 ,把 欧 氏 几何 中 的 线段 
叫 “ 棒 棒 ”, 圆 叫 * 图 圈 ”, 整 日 迷恋 着 棒 棒 和 轩 圈 组 成 的 图 形 。 当 父亲 知道 他 自行 证 明 ,独立 地 
发 现 了 三 角形 的 内 角 和 定理 时 ,不 禁 惊喜 交加 ,叹服 他 的 几何 才能 ,从 此 不 再 阻止 他 学 习 数 学 
了 ,还 送 给 他 一 部 4 几何 原本 》。 

从 14 岁 起 ,帕斯卡 经 常 随 父亲 参加 巴黎 一 群 数 学 家 的 每 周 聚会 (法 国 科 学 院 就 是 从 这 发 
展 起 来 的 ) ,耳濡目染 ,使 帕斯卡 在 科学 之 路 上 迅速 成 长 。1639 年 , 当 笛 沙 格 构造 的 射影 空间 
遭 非 议 、 受 排斥 时 ,只 有 帕斯卡 为 其 新 思想 所 吸引 。 他 用 笛 沙 格 的 射影 观点 研究 圆锥 曲线 ,得 
到 许多 令 人 欣喜 的 新 发 现 。 

1640 年 ,16 岁 的 帕斯卡 发 表 了 《 试 论 圆锥 曲线 》 的 8 页 论文 ,文中 包含 了 3 条 定义 ,3 个 推 
理 和 一 些 定 理 。 其 中 一 个 定理 被 认为 是 射影 几何 中 最 重要 的 定理 : “圆锥 曲线 的 内 接 六 边 形 ， 
延长 相对 的 边 得 到 3 个 交点 ,这 3 点 必 共 线 ”。 该 定理 命名 为 帕斯卡 定理 ,定理 中 的 六 边 形 叫 
做 “神秘 六 边 形 ”。 据 说 帕斯卡 从 这 个 定理 导出 了 400 多 条 推论 。 帕 斯 卡 定理 向 人 们 展示 了 射 
影 几 何 深刻 、 优 美的 直观 魅力 ,其 密 伟 壮观 的 气势 令 人 惊叹 ! 

作为 稍 卡 儿 的 学 生 , 在 解析 法 风靡 一 时 ,同时 代 人 都 不 愿意 接受 射影 观点 的 潮流 下 , 帕 斯 
卡 独树一帜 ,用 纯 几 何 的 方法 发 现 了 神秘 六 边 形 ,取得 了 自古 希腊 阿波 罗 尼 斯 以 来 研究 圆锥 曲 
线 的 最 佳 成 果 ,为 射影 几何 大 厦 黄 定 了 基石 。 帕 斯 卡 的 精神 难能可贵 。 据 说 笛 卡 儿 读 了 他 的 
著作 后 大 为 叹服 , 竟 不 相信 是 出 自 自己 的 学 生 , 一 位 16 岁 少 年 之 手 。 

从 上 面 这 个 例子 中 可 以 看 出 ,一旦 对 于 系统 设计 的 原理 有 了 深刻 的 掌握 ,对 于 某 一 个 模块 
的 设计 有 了 系统 .完整 的 实现 ,那么 对 于 其 他 系统 或 模块 的 设计 就 会 触 类 旁 通 , 以 至 于 赁 直觉 
就 可 以 推 想 在 一 个 未 知 领域 应 该 如 何 设计 ,而 不 在 于 它 的 形式 上 是 “ 棒 棒 ?还 是 “直线 ”, 是 Vx- 


Works 还 是 WinCE, 其 实质 都 是 一 样 的 。 

本 书 重 在 讲解 嵌入 式 操作 系统 软件 设计 的 一 些 原理 和 方法 。 讨 论 思 想 虽然 是 一 个 哲学 的 
范畴 , 而 不 是 设计 的 问题 。 但 一 个 软件 产品 的 设计 好 坏 ,归根 结 底 是 在 于 一 个 人 的 品 性 ,一 个 
人 的 品 性 决定 一 个 人 能 够 把 任何 事情 做 到 什么 样 的 水 平 。 所 以 在 设计 实践 中 ,除了 要 学 习 专 
业 知 识 , 培 养 专业 技能 ,更 多 地 ,还 要 培养 自己 认真 负责 的 态度 ,锻炼 程序 设计 的 意志 ! 中 国有 
名 “宝剑 锋 从 磨 大 出 ,梅花 香 自 苦寒 来 ”的 名 言 。 程 序 的 设计 、. 艇 和 人 式 软件 的 设计 、 操 作 系 统 原 
理 的 理解 以 及 对 总 线 协议 的 理解 ,都 需要 设计 人 员 艰 苦 的 劳动 。 
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本 篇 就 笔者 的 理解 来 讨论 一 些 骨 人 式 软件 设计 所 必 备 的 基础 技能 。 如 果 读 者 急于 了 解 舱 
人 式 系统 软件 设计 的 方法 ,可 以 直接 跳 到 第 二 篇 “驱动 模型 篇 >”。 借 用 一 些 老 套 的 话 “万 丈 
高 楼 从 地 起 关 磨 刀 不 误 砍 柴 功 ”, 打 好 扎实 的 基础 是 非常 重要 的 。 在 我 看 来 ,对 嵌入 式 软 件 系 
统 的 基本 要 求 是 高 效 和 稳定 , 它 要 求 软 件 开发 人 员 设 计 出 的 程序 逻辑 严密 ,层次 清楚 ,效率 优 
化 ,品质 高 精 ; 与 此 同时 ,软件 需要 与 硬件 系统 打交道 ,需要 处 理 复杂 的 应 用 问题 ,涉及 到 的 专 
业 面 广泛 且 深 入 ,由 此 软件 开发 人 员 还 需要 掌握 很 多 复杂 的 专业 知识 。 所 以 ,基础 与 方法 对 于 
舱 和 人 式 软件 的 设计 至 关 重 要 。 

本 书 虽 然 不 求 将 各 种 专业 知识 与 技能 讲解 得 全 面 透 彻 ,但 希望 笔者 多 年 积累 的 一 些 点 滴 
经 验 ,能 够 给 读者 带 来 开门 指 路 的 功效 。 

1. 心理 准备 

如 上 所 述 ,圣人 式 软件 的 设计 是 一 项 极其 艰辛 复杂 的 程序 设计 工作 , 它 需 要 有 丰富 .扎实 
的 专业 知识 ,还 需要 有 艰苦 卓绝 . 狗 而 不 舍 . 敢 于 拼搏 和 敢于 挑战 的 精神 。 在 最 开始 着 手 研究 
笠 入 式 软 件 开发 时 ,就 需要 树立 脚踏实地 的 学 习 和 工作 作风 ,在 设计 工作 中 要 实事 求 是 ,不 能 
脐 想 ,不 能 武断 ,不 能 自 大 。 

另外 ,也 要 去 除 心目 中 的 苦难 情绪 和 神秘 观念 。 只 要 认真 学 习 、 深 入 钻研 ,就 可 以 设计 出 
性 能 优秀 的 蔡 和 人 式 产 品 ; 只 要 思路 清晰 方法 正确 ,也 可 以 创造 奇迹 。 

嵌 人 式 软件 系统 既是 软件 设计 ,又 是 艺术 设计 。 它 要 求 不 但 要 实现 产品 的 功能 ,还 要 设计 
出 友好 、 易 用 、 能 够 一 眼 就 吸引 住 用 户 眼球 的 界面 。 所 以 内 人 式 软件 不 但 要 求 内 部 结构 精细 ， 
还 要 求 外 部 界面 设计 精细 ,每 一 个 细微 角落 都 要 体现 出 设计 者 的 独具匠心 ! 

诚然 ,嵌入 式 软件 设计 也 是 软件 设计 人 员 人 生 的 一 大 乐趣 。 当 一 个 产品 从 你 手中 诞生 时 ; 
当 一 个 用 户 津津 乐 道 地 使 用 一 个 PS2 玩 一 个 游戏 ,或 者 使 用 一 个 手持 设备 观看 一 部 惊险 电影 
时 ; 当 一 名 工作 人 员 使 用 办 公 室 的 大 屏幕 进行 远程 监控 ,或 远程 操作 一 个 复杂 的 机 器 设备 时 ; 
如 果 这 些 软件 系统 都 是 出 自 于 自己 的 作品 ,那么 这 些 岂 不 是 为 之 振奋 的 事情 ? 

当 大 家 有 了 这 些 心理 准备 ,有 了 这 些 远景 的 乐趣 ,就 会 为 自己 的 学 习 产 生 巨 大 潜能 和 动 
力 。 兴 趣 是 攻克 难关 的 先导 ,希望 读者 带 着 强烈 的 兴趣 阅读 完 本 书 ! 
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2. 知识 与 技能 准备 

作为 一 位 嵌入 式 软件 工程 师 , 需 要 做 哪些 准备 工作 ,需要 掌握 哪些 工具 .哪些 技能 ,才能 顺 
利 着 手 嵌 人 式 软件 的 开发 呢 ? 如 引言 中 所 讨论 的 ,有 4 项 基本 功 非 常 重要 而 且 是 必须 培养 与 
掌握 的 : 

一 是 程序 基础 。 

二 是 操作 系统 原理 。 

三 是 硬件 知识 , 即 接口 技术 ,包括 总 线 以 及 一 些 外 部 设备 。 

四 是 编译 调试 工具 及 调试 能 力 。 

后 面 章节 将 对 这 些 基 本 知识 与 技能 逐一 进行 讨论 。 
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任何 一 个 软件 产品 都 是 通过 程序 来 实现 的 ,程序 能 力 是 软件 产品 实现 的 最 根本 能 力 。 尤 
其 对 于 复杂 的 散人 式 系统 设计 工程 ,只 有 具备 了 深厚 的 程序 功底 ,才能 比较 轻松 地 走 人 艇 入 式 
软件 设计 的 大 门 。 嵌 人 式 软件 的 程序 设计 要 求 程 序 员 逻辑 严密 .思路 清晰 .语言 精炼 ,对 每 一 
个 函数 和 每 一 个 数据 结构 的 设计 ,都 要 表达 精准 ,都 要 围绕 一 个 模块 的 实现 目标 去 精心 设计 。 

之 所 以 特别 强调 程序 能 力 , 不 仅仅 是 因为 它 非 常 重要 ,更 因为 无 论 是 在 聘用 软件 工程 师 
时 ,还 是 在 检查 一 些 软件 工程 师 所 设计 的 程序 时 ,都 会 发 现 很 多 粗糙 的 设计 。 由 此 看 出 ,嵌入 
式 软件 设计 者 对 于 程序 重要 性 的 认识 并 不 够 。 随 着 技术 的 发 展 和 进步 ,新 的 技术 不 断 涌 现 , 嵌 
入 式 软件 产 品 的 设计 对 于 人 的 要 求 也 越 来 越 高 ,由 此 , 绝 大 多 数 人 把 目光 集中 在 对 协议 的 学 习 
和 理解 上 ,而 忽略 了 软件 实现 的 程序 能 力 这 一 基本 功 。 

另外 ,很 多 初学 者 ,或 是 在 校 学 生 , 由 于 没有 从 事 太 多 的 程序 设计 实践 ,往往 只 学 习 了 书本 
上 的 一 些 基础 程序 语法 ,或 是 在 实验 室 编译 通过 了 一 些 练习 程序 ,这 对 于 实际 的 项 目 开发 是 远 
远 不 够 的 。 

本 书后 续 内 容 会 针对 一 些 相关 的 程序 题目 进行 讨论 ,从 这 些 讨论 中 可 以 看 出 大 多 数 人 的 
程序 设计 能 力 仍然 很 低 。 究 其 原因 ,一 方面 是 因为 上 面 所 说 的 新 技术 的 涌现 ,对 于 专业 知识 
需求 占据 了 从 业 人 员 的 学 习 销 研 时 间 ; 另 一 方面 ,因为 目前 存在 大 量 的 开源 软件 ,以 及 别人 已 
经 实现 的 代码 ,或 者 第 三 方 代码 ,从 而 软件 工作 者 从 头 到 尾 设计 一 个 项 目的 机 会 非常 小 。 很 大 
一 部 分 人 是 在 基于 别人 的 实现 上 进行 局 部 修改 ,这 种 修改 客观 上 导致 维护 人 员 并 不 理解 设计 


者 的 完整 意图 ,加 之 设计 初创 者 并 不 是 针对 一 个 完整 的 项 上 且 所 做 的 精心 设计 ,由 此 导致 在 此 基 
础 上 修改 出 来 的 工程 设计 根基 不 牢 、 实 现 粗糙 。 最 终结 果 是 模块 或 系统 经 常 面临 不 稳定 状态 ， 
从 而 迟 迟 不 能 产品 化 ,即便 勉强 推 向 市 场 , 也 是 漏洞 甚 多 ,错误 百出 。 因 此 , 打 好 程序 基础 是 至 
关 重 要 的 。 


1.1.1 设计 高 性 能 程序 的 必要 性 


在 人 们 常常 看 到 的 一 些 协议 软件 ,或 者 一 些 操作 系统 里 的 服务 原 语 中 ,专业 的 程序 设计 师 
能 够 通过 简短 的 几 行 代码 ,表达 出 常人 用 几 百 . 几 千 行 代码 都 难以 实现 的 逻辑 功能 。 程 序 设 计 
中 ,代码 量 的 多 少 往往 与 软件 的 质量 性能、 稳定 性 和 健壮 性 成 反比 。 程 序 基本 功 是 一 个 “ 锤 
炼 ” 的 过 程 ,程序 设计 基本 功 与 技巧 的 练习 永 无 止境 ,是 一 个 逐步 提高 的 过 程 。“ 锤 与 “ 炼 ” 需 
要 具备 坚强 的 意志 ,不 能 停留 在 肤浅 的 表面 ,要 求人 们 肯 动 脑筋 ,深入 钻研 ,在 实践 中 汲取 前 人 
的 设计 精华 。 此 外 ,还 需要 具有 对 事业 的 热情 ,只 有 拥有 热情 ,才能 产生 持久 动力 。 

除 此 之 外 ,程序 功底 的 “锤炼 还 体现 一 个 人 的 责任 感 , 首 先 它 体现 对 自己 所 从 事 事业 的 责 
任 , 即 对 自身 的 责任 ;其 次 体现 对 自己 所 负责 的 项 目 . 团 队 ,. 所 在 公司 的 责任 。 


1.1.2 庶 入 式 软件 的 设计 范畴 


典 人 式 软件 对 于 大 多 数 程序 员 来 说 不 再 是 一 个 陌生 的 字眼 ;但 是 , 面 对 复 杂 的 软件 系统 ， 
却 令 一 些 初学 者 望而却步 ,显得 高 深 莫 测 。 

由 于 嵌入 式 软件 不 只 是 涉及 字 处 理 .数据 表格 .媒体 播放 、 网 络 应 用 、 聊 天 互动 等 常规 的 应 
用 程序 , 它 还 涉及 各 种 应 用 产品 所 必需 的 中 间 件 ,底层 核心 平台 的 开发 ,底层 操作 系统 的 核心 
组 件 , 各 种 外 部 设备 驱动 ,整个 应 用 产品 的 系统 配置 和 引导 程序 ,以 及 产品 管理 .调试 .升级 等 
各 个 方面 。 因 此 , 骨 入 式 软件 是 一 个 庞大 的 体系 。 与 此 同时 , 岩 人 式 软件 还 要 求 具有 高 度 的 稳 
定性 和 实时 人 性。 

粗略 说 来 , 嵌 人 式 产品 作为 一 个 完整 ,独立 的 设备 产品 , 它 所 需 开 发 的 主要 软件 组 件 包括 
艇 人 式 操作 系统 和 应 用 程序 这 两 大 核心 部 分 。 前 一 部 分 提供 应 用 软件 运行 的 平台 ,后 一 部 分 
解决 各 种 各 样 的 实际 应 用 问题 , 比如 ,播放 一 部 电影 或 者 听 一 首 MP3 ,阅读 新 闻 , 浏 览 照片 ， 
等 等 。 

操作 系统 平台 软件 以 及 应 用 程序 软件 都 是 可 以 看 得 见 、 摸 得 着 的 部 分 ,也 就 是 说 ,是 为 众 
多 软件 设计 者 所 熟知 的 部 分 。 除 此 之 外 ,嵌入 式 软 件 的 设计 还 包括 对 产品 系统 的 管理 程序 , 常 
常 称 这 一 部 分 程序 为 固件 程序 (firmware) 。 它 们 驻 留 于 产品 的 存储 设备 中 ,平常 不 为 程序 员 
和 产品 用 户 所 感知 。 作 为 一 个 完整 产品 的 国 件 程序 , 它 与 人 们 常 说 的 某 个 外 部 设备 如 USB 设 
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备 的 固件 程序 ,或 者 音 视 频 编 解码 的 固件 程序 不 同 。 后 者 主要 是 内 赃 在 某 个 设备 之 中 ,或 者 装 
人 到 系统 内 存 里 , 目的 是 扩充 使 用 硬件 的 部 分 或 全 部 功能 。 而 作为 一 个 产品 的 固件 程序 ,其 功 
能 类 似 于 个 人 电脑 里 的 BIOS, 它 需要 管理 整个 产品 系统 ,保存 系统 配置 数据 ,做 系统 必要 的 初 
始 化 工作 ,引导 操作 系统 ,更 新 整个 系统 的 软件 ,以 及 当 系 统 出 现 严重 错误 时 进行 诊断 与 系统 
恢复 。 

综 上 所 述 , 内 人 式 软件 大 体 分 为 3 类 :一 是 操作 系统 平台 软件 ,二 是 应 用 软件 ,三 是 产品 化 
软件 。 产 品 化 软件 是 对 前 两 类 实体 的 包装 ,是 对 整个 产品 的 管理 ,包括 引导 、 以 及 必要 的 调试 、 
下 载 和 升级 等 辅助 功能 。 

1， 骨 入 式 平台 软件 

为 什么 要 设计 嵌入 式 平台 软件 ?对 于 应 用 软件 开发 的 工程 师 来 说 ,平常 很 少 关心 平台 软 
件 的 事情 。 为 什么 在 嵌入 式 系统 的 设计 中 要 提 平 台 软 件 呢 ? 

由 于 艇 人 式 产品 硬件 的 不 通用 人 性, 即 各 个 厂家 所 设计 的 SoC 硬件 互 不 兼容 ,因此 就 没有 
一 个 完全 通用 的 软件 产品 是 针对 特定 某 一 个 硬件 环境 设计 的 。 这 方面 与 PC 机 的 体系 架构 和 
软件 体系 架构 完全 不 同 。 

PC 机 的 硬件 体系 目前 只 有 几 大 阵容 ,最 大 的 PC 机 提供 商 Intel, 使 用 了 大 家 熟知 的 x86 
体系 ,采用 标准 的 PCI 总 线 , 南 桥 北桥 结构 ; 另 一 硬件 体系 的 提供 商 AMD, 也 使 用 了 几乎 与 
x86 类 似 的 CPU 指令 系统 ,只 是 在 内 存 管理 方式 上 去 除了 老式 .繁杂 的 段 页 模式 。PC 机 硬件 
体系 结构 的 相对 单一 ,给 系统 软件 的 实现 带 来 了 极 大 的 便利 和 兼容 的 可 能 。 软 件 方面 ,微软 的 
Windows 操作 系统 平台 占据 了 主流 ,各 个 PC 硬件 厂商 所 提供 的 软件 支持 都 会 兼容 Windows 
平台 。 除 此 之 外 ,Linux 也 被 广泛 用 于 PC 硬件 平台 。 由 于 它们 的 底层 硬件 体系 很 相似 ,所 以 
系统 软件 都 相似 ;对 于 不 同 的 PC 设备 ,只 要 增加 支持 不 同 硬件 所 需 的 驱动 软件 即 可 。 与 此 同 
时 ,在 PC 平台 下 ,广大 程序 员 也 只 需 关心 操作 系统 平台 之 上 的 应 用 程序 的 开发 ,例如 数据 库 、 
播放 软件 、 财 务 软 件 、 聊 天 软件 .绘图 软件 和 网 页 制作 软件 等 。 

但 是 在 嵌入 式 软件 领域 中 ,这 个 情形 发 生 了 显著 的 变化 。 嵌 入 式 硬件 设备 商 往往 为 了 解 
决 某 些 专用 问题 而 设计 出 专用 的 SoC 芯片 。 首 先 ,这 些 SoC 芯片 采用 了 不 同体 系 结构 的 
RISC CPU ,比较 著名 的 有 MIPS,ARM,PowerPC 等 ,它们 从 指令 集 上 就 完全 不 同 。 其 次 ,每 
个 SoC 芯片 定义 了 完全 不 同 的 地 址 分 布 和 引 脚 功能 ,并 且 片 内 集成 的 外 围 设 备 也 互 不 相同 。 
因此 ,为 某 一 个 硬件 芯片 组 所 编写 的 与 硬件 相关 的 软件 ,在 另 一 个 芯片 组 系统 里 完全 不 能 使 
用 。 换 句 话 说 ,一 个 开发 团队 的 软件 工程 师 需 要 针对 不 同 的 硬件 平台 开发 或 移植 不 同 的 固件 
程序 .操作 系统 程序 和 应 用 程序 。 

由 此 看 来 ,嵌入 式 软件 设计 的 范畴 非常 广泛 ,这 对 于 嵌入 式 软件 设计 程序 员 来 说 是 一 个 非 
常 严 峻 的 挑战 。 因 为 一 个 团队 要 负责 某 电 子 产 品 嵌 入 式 软件 设计 的 方方面面 ,最 终 要 向 市 场 
或 向 用 户 递交 一 个 完整 的 .该 电子 产品 所 涉及 的 软件 系统 。 
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2. 应 用 软件 

应 用 软件 的 开发 与 在 PC 机 系统 里 开发 的 各 种 财务 .邮件 和 通信 程序 非常 类 似 , 也 可 以 使 
用 图 形 化 控件 .可视化 工具 .脚本 工具 和 面向 对 象 语言 等 来 设计 ,但 两 者 还 有 很 多 关 别 

首先 ,运行 的 平台 不 一 样 ,指令 系统 不 一 样 , 因 此 ,必须 使 用 交叉 编译 工具 进行 编译 。 在 纵 
和信 式 设备 里 运行 的 所 有 库 文件 和 各 种 依赖 文件 必须 全 部 是 针对 这 个 平台 的 二 进 制 格式 文件 。 


其 次 , 秋 人 式 平台 提供 的 调用 接口 库 不 如 PC 机 平台 中 的 完备 ,有 些 模块 可 能 没有 实现 ， 


有 些 函数 调用 也 可 能 没有 实现 ;有 些 功能 类 似 的 函数 调用 ,和 名字 可 能 不 同 ,所 使 用 的 参数 也 可 
能 不 同 。 那 么 针对 这 些 类 似 的 情况 ,就 必须 了 解 这些 平 台所 提供 的 具体 功能 ;在 设计 应 用 时 ， 
对 于 平台 没有 实现 的 功能 ,就 必须 通过 其 他 方法 来 实现 ,或 者 自己 在 程序 中 将 这 些 功能 实现 。 

在 设计 其 入 式 应 用 软件 时 还 要 考虑 跨 平台 的 需求 ,以 增强 所 开发 软件 的 通用 性 。 由 于 各 
种 操作 系统 的 差异 和 各 个 硬件 平台 的 不 同 ,必要 时 可 能 需要 对 一 些 系统 调用 进行 封装 ,以 实现 
跨 平 台 的 外 部 接口 的 一 致 性 。 

例如 , 某 公 司 开发 了 一 个 浏览 器 ,为 了 在 不 同 操作 系统 平台 上 推广 ,或 者 在 不 同 硬件 平台 
和 不 同 图 形 界面 上 推广 , 则 该 浏览 器 在 实现 时 须 将 那些 调用 操作 系统 .调用 图 形 输出 的 接口 抽 
象 出 来 ,以 提供 单一 的 外 部 接口 。 比 如 定义 创建 线程 的 画 数 create_brws_thread() ,create_ 
brws_semaphore( ) ,init_brws_graphics ( )，create_brws_device_context( )，create_brws_ 
event_queue() ,brws_rect_fill() ,brws_line_to() ,brws_draw_text() ,等 等 。 

除了 使 用 统一 的 接口 外 ,还 可 以 使 用 编译 宏 来 包含 不 同 平台 或 不 同 硬件 系统 下 的 特定 代 
码 。 例 如 ， 

井 iftdef _WINCE_PLRAT_ 

// code for WinCE pl1atform 

井 elif defined (_LINUX_PLRAT) 

// code for Linux Platform 

井 endif 


3. 产品 固件 程序 

最 常见 的 产品 固件 程序 就 是 Boot-loader。Boot-loader 的 基本 功能 是 在 设备 电源 上 电 的 
最 初 过 程 中 ,对 硬件 进行 必要 的 设置 ,以 使 整个 硬件 平台 工作 于 可 知 的 预定 状态 ,比如 ,在 产品 
设备 上 电 时 ,中 断 控制 寄存 器 的 中 断 请 求 位 或 中 断 允 许 位 可 能 存在 随机 的 不 确定 值 , 各 个 外 部 
设备 的 寄存 器 值 也 可 能 处 于 随机 状态 ,这 些 不 确定 值 可 能 导致 不 期 望 的 中 断 产生 ,或 者 影响 系 
统 的 正常 运行 ,这 些 情 况 都 需要 对 硬件 设备 进行 初始 设置 。Boot-loader 随后 的 工作 是 初始 化 
内 存 , 开 辟 系 统 正常 工作 的 存储 空间 ,设置 调用 函数 时 所 需 用 的 栈 ,禁止 中 斯, 必要 时 ,开局 
cache, 使 能 MMU ,然后 将 操作 系统 从 指定 的 ROM 区 域 搬运 到 系统 内 存 中 ,并 开始 运行 它 。 

除了 Boot-loader 的 这 些 基 本 功能 之 外 ,固件 程序 还 有 许多 扩展 功能 。 比 如 下 载 功 能 、 调 
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试 功能 .与 用 户 交 互 的 功能 和 编程 Flash 的 功能 ,等 等 。 为 此 ,Boot-loader 里 面 需要 实现 一 些 
额外 的 驱动 ,例如 ,用 于 下 载 的 串口 驱动 ,网 络 驱动 ,USB 驱动 ,用 于 调试 的 串口 驱动 ,以 及 用 
于 编程 Flash 的 驱动 。 为 了 支持 这 些 设 备 , 除 了 驱动 之 外 ,还 需要 一 些 协议 的 实现 ,如 UDP 协 
议 以 及 对 文件 系统 的 简要 支持 。 

另外 ,Boot-loader 还 需要 管理 一 些 额 外 的 有 关系 统 配 置 的 信息 ,比如 ， 操作 系统 存放 的 位 
置 , 电 源 电 量 的 数值 ,或 其 他 与 设备 相关 的 用 户 设置 等 。 这 些 数据 可 能 存放 在 固件 程序 的 某 个 
数据 区 域 ,以 便 在 系统 引导 时 能 够 正确 加 载 到 操作 系统 ,对 设备 进行 正确 的 配置 。 


1.1.3 庶 入 式 软件 的 分 层 结 构 


在 一 个 复杂 系统 的 设计 中 ,层次 结构 模型 永远 是 适用 的 ,也 是 必需 的 。 在 上 面 所 讲 的 三 大 
组 件 中 ,产品 固件 程序 , 即 系统 固件 程序 是 系统 的 一 个 管理 监控 程序 。 系 统 固件 程序 的 一 个 重 
要 任务 就 是 执行 硬件 初始 化 ,例如 ,禁止 中 断 , 初 始 化 内 存 , 清 理 cache 等 最 基本 的 操作 ,从 而 
将 设备 在 加 电 之 后 置 于 确定 的 起 始 (“ 零 ”状态 ;然后 再 把 操作 系统 加 载 ( 复 制 或 解压 缩 ) 到 内 
存 中 ,并 开始 执行 。 在 此 之 后 , 它 的 使 命 即 算 完 成 。 

一 些 固件 程 序 在 加 载 完 操作 系统 之 后 还 可 能 继续 为 操作 系统 提供 服务 ,比如 台式 机 中 的 
BIOS。BIOS 命名 为 基本 输入 /输出 系统 (Basic Input and Output System) ,顾名思义 ,其 主要 
作用 就 是 为 操作 系统 提供 低级 的 输入 /输出 调用 ,直接 操作 输入 /输出 硬件 设备 ,由 此 为 操作 系 
统 提 供 后 续 服 务 。 同 样 , 对 于 便携 式 嵌 和 人 式 设 备 , 一 些 私有 的 配置 数据 如 果 交 由 固件 程序 来 处 
理会 更 加 灵活 ,性 能 会 更 加 稳定 。 因 此 ,在 一 些 系统 设计 中 , 当 操 作 系统 加 载 之 后 ,固件 程序 仍 
然 会 驻 留 于 内 存 , 系 统 程序 仍然 可 以 通过 软件 中 断 的 方式 调用 固件 程序 提供 的 某 些 服务 ,来 实 
现 对 产品 设备 私有 数据 的 存 取 操作 。 

如 前 所 述 ,平台 软件 和 应 用 程序 是 一 个 系统 设备 的 实体 软件 。 对 于 一 个 系统 在 正常 使 用 
时 的 实体 软件 ,为 了 简化 设计 ,可 以 将 它们 划分 出 一 些 层次 来 。 实 践 中 ,一 个 小 小 的 软件 团队 
没有 办 法 从 头 到 尾 设计 一 个 完整 的 软件 系统 。 由 此 ,需要 对 一 个 大 的 系统 进行 分 解 ,从 中 提炼 
出 一 些 公 用 模块 ,由 此 构成 一 个 公有 平台 ,它们 就 是 与 硬件 无 关 的 软件 层次 。 现 在 有 很 多 嵌 和 人 
式 操 作 系统 提 供 商 ,他 们 开发 和 维护 了 绝 大 部 分 操作 系统 核心 功能 ,这 部 分 核心 功能 包括 基本 
的 操作 系统 组 件 , 如 进程 调试 ,内 存 管 理 , 文 件 系 统 , 基 本 的 输入 /输出 子 系统 ,图 形 子 系统 ,网 
络 通信 协议 子 系统 。 除 此 之 外 ,在 设备 管理 方面 ,也 包含 与 硬件 无 关 的 公用 处 理 模 块 ,或 者 与 
通用 硬件 相关 的 软件 模块 ,例如 一 些 总 线 的 驱动 。 

软件 分 层 给 人 们 带 来 了 极 大 利益 ,诸如 微软 ,GNU 开源 软件 , 风 河 公司 ,他 们 提供 了 很 多 
可 选 的 基本 平台 ,如 ,微软 提供 的 WinCE 和 Windows Mobile; Monta Vista 等 公司 提供 的 傣 人 人 
式 Linux-2.4,2.6, 等 多 个 版 本 的 源 代 码 ; 风 河 公 司 (WindRiver) 提 供 的 VxWorks。 这些 专业 
的 实时 操作 系统 RTOS(CReal Time Operating System) 提供 商 把 操作 系统 中 与 硬件 无 关 的 代 
码 部 分 抽象 出 来 ,封装 成 统一 的 .标准 化 的 软件 包 。 
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采取 分 层 的 结构 之 后 , 留 给 OEM 开发 商 所 要 实现 的 系统 软件 大 大 减少 。 作 为 芯片 厂商 
或 硬件 厂商 ,只 须 关 心 .修改 或 重新 设计 与 特定 硬件 相关 (与 其 他 硬件 平台 不 同 的 硬件 ) 的 驱动 
代码 .系统 配置 及 硬件 系统 管理 , 即 “ 设 备 相关 ?代码 。 而 这 一 层 代 码 可 以 很 “ 薄 ”, 有 时 又 叫做 
“硬件 抽象 展 ”, 或 者 “OAL? 层 (OEM 适 配 层 ) ,体现 在 内 人 式 操 作 系统 设计 上 ,又 叫做 BSP( 板 
级 支持 包 :Board Support Package) ,该 部 分 程序 设计 工作 就 是 将 在 第 三 篇 中 重点 介绍 的 内 容 。 
图 1- 1 显示 了 艇 人 式 软件 分 层 结 构 的 粗略 框图 。 


中 间 件 (多 媒体 编 解 码 库 , IPv6, SIP, 电视 中 间 件 , …) 应 用 程序 


操作 系统 核心 (文件 系统 ， 设 备 管理 器 ， 进 程 调度 ， 图 形 


窗口 子 系统 ，… ) 


CPU 适 配 软件 (MIPS,ARM…) 


SOC (MIPS,ARM 核 心 ) 


1-1 慌 入 式 软件 的 分 层 结构 


经 过 这 样 的 分 层 之 后 ,OEM 开发 商 只 需 专注 于 OAL 层 (OEM Adaption Layer, 即 原始 设 
备 制造 商 适 配 层 ) 的 开发 ,而 不 必 关 心 操 作 系 统 核心 的 框架 及 其 实现 细节 。 开 发 人 员 的 任务 就 
是 根据 用 户 系 统 的 需求 ,选择 一 款 合适 的 .与 所 开发 硬件 平台 最 接近 的 散人 式 系统 平台 软件 包 
来 作为 开发 的 基点 ,移植 或 重新 设计 这 些 模块 , 即 可 在 所 开发 硬件 平台 上 实现 特定 的 实时 操作 
系统 (RTOS) 。 

随 着 开发 的 深入 和 完善 ,在 设计 后 期 也 可 能 涉及 对 整个 系统 性 能 的 优化 (tuning) ,必要 时 
可 对 操作 系统 的 内 核 进 行 优化 .剪裁 和 加 速 , 尤 其 对 于 开源 的 Linux 系统 ,为 开发 者 提供 了 广 
阔 的 优化 空间 。 

应 用 程序 也 可 以 分 层 。 可 以 把 一 些 通用 的 模块 提炼 出 来 ,为 更 多 的 应 用 提供 统一 的 接口 ， 
以 提供 一 组 通用 的 服务 。 这 些 通用 模块 依赖 于 操作 系统 提供 的 应 用 接口 ,为 各 种 各 样 的 应 用 
程序 提供 服务 。 对 于 这 些 模块 ,有 时 称 它们 为 中 间 件 ,有 时 也 把 它们 作成 标准 的 库 文 件 。 

之 所 以 称 之 为 中 间 件 ,是 因为 它们 的 层次 位 于 操作 系统 核心 与 应 用 程序 之 间 ; 还 因为 它们 
既 可 运行 于 操作 系统 核心 的 地 址 空间 ,也 可 运行 于 用 户 地 址 空间 。 从 打包 的 形式 来 看 ,中 间 件 
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可 以 与 操作 系统 的 平台 软件 一 起 打包 提供 ,或 者 以 一 个 库 文件 (动态 库 或 静态 库 )? 的 形式 ,提供 
一 个 与 操作 系统 分 离 的 软件 包 。 

对 于 与 操作 系统 一 起 打包 的 情形 ,中 间 件 则 更 像 操 作 系统 的 一 部 分 ,或 对 操作 系统 的 扩 
展 。 如 多 媒体 应 用 处 理 器 里 含有 很 多 视频 编码 器 和 解码 器 ,如 果 用 DirectX 来 实现 滤波 器 
(filters) ,就 可 以 把 滤波 器 程序 放 在 操作 系统 的 代码 树 下 面 , 在 编译 时 与 操作 系统 一 起 编译 ， 
从 功能 上 看 对 于 视频 编码 器 /解码 器 的 支持 就 相当 于 对 现 有 操作 系统 功能 的 扩展 。 对 于 与 操 
作 系 统 分 离 打包 的 情形 ,可 以 把 中 间 件 程序 编译 成 单一 的 库 或 作成 动态 库 ,与 特定 的 应 用 程序 
一 起 编译 链接 ,在 用 户 地 址 空间 运行 。 无 论 哪 种 打包 形式 ,只 是 在 打包 、 链 接 的 位 置 和 运行 的 
地 址 空间 上 存在 差别 ,其 实质 都 一 样 ,都 是 为 应 用 程序 实现 特定 .通用 的 功能 。 中 间 件 都 是 软 
件 分 层 的 产物 ,因此 一 些 软件 开发 商 可 以 独立 于 特定 的 工程 项 目 , 专 业 致 力 于 某 些 中 间 件 的 开 
发 ,从 而 提供 功能 全 面 通用 、 性 能 稳定 的 模块 实现 。 

目前 比较 多 的 中 间 件 例子 有 :电视 中 间 件 ,它们 提供 DVB,ATSC 的 节目 信息 分 析 , 提供 
EPG 数据 .频道 管理 和 配置 储存 ;SIP 中 间 件 ,它们 提供 VoIP 的 链接 建立 ;各 种 音 视 频 解 码 显 
示 用 的 DirectX 滤波 器 中 间 件 等 。 

从 本 质 上 说 ,中 间 件 是 一 些 标准 的 函数 库 , 有 了 它 可 使 用 户 程序 设计 者 专注 于 解决 用 户 问 
题 .界面 问题 和 应 用 程序 的 整体 控制 等 问题 ,而 把 一 些 核心 的 实现 抽象 出 来 ,由 专业 队伍 精心 
实现 及 维护 。 所 以 ,中 间 件 是 软件 分 层 的 产物 ,是 由 第 三 方 为 某 个 应 用 领域 开发 的 通用 程 
序 包 。 

由 此 可 见 , 从 操作 系统 到 应 用 程序 ,都 可 以 分 成 许多 层次 ,一 个 层次 中 还 可 以 划分 更 小 的 
层次 。 在 某 些 体系 结构 中 ,设备 驱动 程序 划分 为 两 个 层次 ,例如 WinCE 中 就 把 一 些 驱 动 分 为 
MDD 层 和 PDD 层 。 后 面 章节 会 进一步 详细 讨论 。 


和 


系统 程序 的 设计 目标 是 提供 通用 的 软件 平台 ,而 应 用 软件 主要 是 解决 各 种 不 同 的 应 用 。 
后 者 往往 可 以 独立 于 平台 ,在 多 个 系统 平台 上 能 够 做 到 兼容 运行 。 

系统 程序 的 设计 内 容 主要 是 底层 的 支持 软件 和 设备 驱动 程序 等 ,而 应 用 程序 则 依赖 于 操 
作 系 统 及 扩展 的 平台 软件 所 提供 的 API( 应 用 编程 接口 ) 来 实现 各 种 各 样 的 应 用 需求 ,包括 可 
交互 的 界面 。 

系统 软件 与 应 用 软件 的 设计 目标 和 内 容 差别 很 大 ,它们 对 于 软件 设计 的 要 求 也 有 很 大 差 
别 。 但 是 无 论 是 应 用 程序 .中 间 件 .软件 库 、 操 作 系统 核心 还 是 固件 程序 ,一句 话 , 它 们 都 是 程 
序 ,都 是 用 代码 写 出 来 的 。 一 个 应 用 程序 员 ,经 过 学 习 与 培训 ,可 以 转向 系统 设计 ;同样 ,一 个 
系统 程序 员 也 可 以 转向 应 用 程序 的 设计 。 然 而 ,所 设计 的 软件 层次 越 靠近 (硬件 ) 底 层 , 对 相应 
软件 的 质量 要 求 也 越 高 ,设计 难度 也 越 大 ,从 而 对 程序 员 的 能 力 要 求 也 越 高 。 
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如 何 才能 达到 系统 程序 员 的 标准 呢 ? 诚然 ,设计 能 力 的 高 低 , 优 秀 与 否 , 没 有 一 个 统一 的 
界定 标准 。 在 学 校 的 课程 考试 中 获得 一 个 高 分 ,并 不 意味 着 一 个 人 的 程序 基础 就 已 经 足够 能 
应 对 系统 软件 的 开发 要 求 。 如 前 面 所 述 ,编程 能 力 需 要 在 长 期 的 设计 实践 中 仔细 推 殴 , 用 心 蔷 
酌 ,历经 千 锤 百 炼 , 逐 步 在 实践 开发 中 学 习 借 鉴 他 人 的 先进 经 验 ,循序 渐进 ,逐步 提高 。 

对 于 为 工业 设备 、 消 费 类 电子 产品 和 个 人 便携 式 设 备 所 开发 的 商业 程序 ,其 稳定 性 .可靠 
性 以 及 效率 等 方面 ,要 比 在 一 个 桌面 系统 平台 上 开发 一 些 应 用 程序 更 加 严格 。 肉 入 式 设 备 ,不 
只 是 一 个 软件 ,而 是 一 个 完整 ,独立 的 设备 ,一 个 永 不 损坏 ,不 会 死机 ,不 会 崩溃 ,甚至 于 不 会 出 
错 的 设备 。 一 个 电子 产品 在 使 用 过 程 中 出 现 死机 ,就 会 被 用 户 认 为 或 抱怨 这 个 电子 产品 损坏 
了 ,而 不 仅仅 是 一 个 软件 次 病 。 如 果 是 一 个 工业 产品 ,程序 的 错误 则 将 导致 重大 损失 ,有 可 能 
带 来 不 可 想象 的 严重 后 果 。 因 此 ,产品 设备 的 系统 程序 必须 健壮 、 稳 定 。 在 条 件 多 许 的 情况 
下 ,应 该 花 尽 可 能 多 的 时 间 对 程序 进行 优化 和 测试 。 

编写 能 够 正确 运行 的 程序 ,只 是 开发 矢 人 式 软件 所 走出 的 第 一 步 , 它 离 商业 程序 的 开发 相 
差 还 很 远 , 所 以 不 能 因为 会 编写 程序 就 沾沾自喜 ,对 自己 有 所 松懈 。 后 面 的 章节 将 通过 一 些 实 
际 例子 探讨 如 何 写 好 C 语言 程序 ,如 何 编写 规范 .商业 化 的 程序 。 下 面 首先 来 讨论 嵌入 式 软 
件 从 代码 编译 后 产生 的 结果 和 代码 编写 形式 上 需要 注意 的 一 些 问 题 。 


1.2.1 代码 结果 的 要 求 


1. 通用 性 

嵌 人 式 系统 软件 体系 十 分 庞大 , 它 要 求 各 个 模块 之 间 的 功能 用 途 分 明 ,模块 划分 .层次 结 
构 都 必须 很 清楚 。 某 个 程序 设计 员 设 计 的 程序 模块 往往 并 不 只 是 被 自己 调用 ,所 以 在 模块 设 
计 的 时 候 必 须 充 分 考虑 通用 性 。 这 对 于 中 间 件 . 库 程序 和 驱动 程序 的 设计 尤为 重要 ,必须 满足 
通用 性 这 一 要 求 。 一 个 模块 常常 会 提供 一 组 调用 接口 (一 组 函数 ) ,调用 者 可 能 用 各 种 不 同 的 
参数 、 使 用 各 种 不 同 的 模式 来 调用 这 个 模块 所 提供 的 服务 (接口 函数 ) ,这 些 调用 甚至 还 有 可 能 
包含 不 合法 的 参数 与 模式 。 对 于 调用 的 不 确定 性 ,一 方面 要 求 开发 者 对 于 模块 编写 完整 的 应 
用 编程 接口 (API) , 另 一 方面 要 求 模块 内 部 函数 的 实现 上 需要 进行 容错 处 理 , 对 各 种 参数 所 历 
经 的 路 径 进 行 妥 善 的 处 理 或 完整 的 实现 ,从 而 为 上 层 提 供 通用 的 编程 接口 。 

2. 健壮 性 

健壮 性 要 求 程序 模块 对 各 种 调用 提供 处 理 ,特别 是 对 用 户 的 非法 调用 能 返回 丛 当 的 出 铺 
处 理 , 而 不 会 导致 整个 程序 ,乃至 整个 系统 的 瘫 疾 。 如 用 户 可 能 传递 了 一 个 没有 初始 化 的 零 指 
针 , 或 用 户 传 过 来 的 参数 超出 了 处 理 的 范围 ,或 超出 了 数组 .队列 的 边界 ,如 此 等 等 ,程序 模块 
都 必须 保持 正常 返回 。 健 壮 性 主要 要 求 对 函数 参数 的 检查 、 对 各 种 合法 调用 的 完整 实现 以 及 
对 非法 调用 的 正确 处 理 , 这 些 都 依赖 于 系统 以 及 该 模块 设计 的 策略 。 
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3. 高 效率 

所 谓 高 效率 ,主要 是 指 代码 的 优化 。 某 些 核心 库 函 数 ,往往 成 百 上 千 次 地 不 停 被 别 的 程序 
模块 所 调用 ,如 memcpy,string 函数 ,数学 函数 ,图 形 操作 函数 ,光标 移动 的 处 理 等 。 后 面 将 介 
绍 软 件 算法 以 及 一 些 实用 的 代码 优化 ,读者 可 以 参考 相关 书籍 学 习 运用 更 多 的 程序 优化 技巧 。 
这 里 要 强调 的 是 ,在 追求 高 效率 的 同时 ,一定 要 注重 代码 的 可 读 性 ,代码 的 层次 结构 一 定 要 清 
楚 ; 在 追求 性 能 的 同时 ,一 定 要 保证 程序 的 健壮 性 ,不 然 顾 此 失 彼 ,忘记 了 全 局 的 通用 性 ,导致 
某 些 局 部 情况 出 错 , 这 是 在 驱动 设计 和 内 核 设计 中 绝对 不 允许 的 。 


1.2.2 代码 形式 的 要 求 


1. 代码 规范 

一 个 商业 上 需要 延续 的 软件 必须 满足 可 维护 性 。 维 护 性 意味 着 后 期 可 能 需要 对 现 有 的 软 
件 进 行 修改 升级 和 扩展 , 复 用 一 些 公 有 的 模块 ( 库 )。 因 此 ,无 论 是 代码 的 注释 ,还 是 程序 的 风 
格 ,都 要 力求 精美 。 代 码 复 用 还 要 求 程 序 高 度 结构 化 和 模块 化 ,由 此 需要 完整 规范 的 文档 描 
述 。 这 往往 是 许多 初学 者 容易 忽略 的 地 方 , 他 们 往往 只 是 追求 功能 的 实现 ,而 忽略 代码 的 形 
式 , 这 给 后 期 的 维护 和 团队 的 合作 带 来 巨大 的 麻 频 和 困难 。 

2. 接口 规范 

除了 源 程序 文件 中 函数 的 实现 需要 规范 外 ,还 应 该 注重 接口 规范 。 在 一 个 复杂 系统 的 设 
计 中 ,整个 系统 可 分 解 成 许多 独立 的 模块 ,每 一 个 模块 实现 各 自 的 特定 功能 。 这 些 模 块 由 不 同 
的 工程 师 或 不 同 的 项 目 开 发 组 来 负责 开发 实现 ,而 这 些 独 立 的 模块 需要 相互 调用 ,共同 协作 才 
能 实现 一 个 大 的 应 用 系统 。 模 块 之 间 的 调用 称 之 为 接口 定义 , 它 通常 包括 输入 参数 .返回 参数 
的 规定 ,接口 所 实现 功能 的 准确 定义 ,函数 调用 的 各 种 限制 ,出 错 表现 , 查 错 办 法 以 及 出 错 处 
理 等 。 

接口 规范 也 往往 是 许多 初学 者 容易 忽略 的 地 方 。 在 开始 开发 正规 项 目 时 ,初学 者 往往 只 
是 写 出 一 堆 杂 乱 无 章 的 代码 ,没有 注释 ,没有 文档 ,或 只 有 少数 几 行 文本 记录 的 文档 ,根本 就 没 
有 标准 的 接口 定义 ,随意 更 改 函 数 原 型 等 ,这 些 都 是 系统 设计 的 大 忌 。 


二 


上 面 讨论 了 开发 和 人 式 软 件 对 代码 结果 和 代码 形式 的 要 求 ,那么 ,如 何 编写 程序 来 达到 这 
些 要 求 呢 ? 
前 面 已 经 说 过 ,程序 的 最 终 表 现形 式 是 指令 序列 以 及 指令 所 处 理 的 数据 。 从 项 目 设计 的 
角度 来 说 ,除了 代码 外 ,文档 是 项 目 设计 的 一 个 重要 组 成 部 分 ,如 同 项 目 设计 的 脉络 一 样 。 
”希望 从 本 书 受益 的 读者 在 未 来 的 程序 实践 中 ,不 要 养 成 无 文档 的 坏 习惯 ,不 要 对 自己 说 ， 
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“我 不 需要 文档 ”。 文 档 可 以 是 简单 手记 和 几 个 条 目 , 也 可 以 规范 到 一 本 手册 一 部 完整 的 公理 
化 的 书 , 如 一 个 文档 标准 ,一 个 API 定义 接口 。 

虽然 不 一 定 要 求 每 一 个 文档 都 如 同 公理 化 体系 那么 严谨 ,但 是 不 能 没有 文档 。 根 据 需 要 
和 重要 性 ,文档 可 以 完整 ,也 可 以 简略 ,有 时 可 能 只 是 随手 记录 ,但 是 一 定 要 养 成 随时 整理 自己 
的 思绪 ,整理 自己 所 写 的 代码 ,整理 自己 的 文档 的 好 习惯 。 

我 们 的 目标 是 要 成 为 一 名 专业 程序 员 ,所 以 一 定 要 遵循 协作 开发 ,长 期 维护 的 观念 。 要 协 
作 与 维护 ,就 必须 有 完整 .甚至 专业 的 文档 。 后 面 着 重 从 如 下 几 方 面 来 讲述 如 何 设计 高 性 能 的 
项 目 程 序 。 

国 系统 分 析 ,定义 接口 ; 

国 :函数 实现 ,添加 注释 ; 

图 清理 代码 ,优化 算法 

国 测试 修订 ,完善 文档 。 

在 未 展开 之 前 需要 申明 一 下 ,每 个 开发 团队 都 有 一 套 自己 的 代码 规范 ,作为 团队 中 的 一 
员 ,必须 遵循 已 有 的 代码 和 文档 规范 。 同 时 ,也 可 以 引进 新 的 思想 ,逐步 完善 .修改 这 些 规 范 。 

文档 和 代码 的 规范 是 开发 人 员 的 约定 俗 成 ,迄今 没有 一 套 规 范 是 最 通用 的 ,或 者 说 是 最 好 
的 ,所 以 这 里 不 是 要 订 出 一 套 规 范 来 ,而 是 将 一 些 设 计 的 基本 问题 和 基本 思路 展示 给 读者 ,为 
读者 提供 一 些 参考 线索 ,以 便 在 内 入 式 软件 的 设计 实践 中 引 以 借鉴 ,不 断 提 高 。 

下 面 就 这 些 开 发 环节 逐个 进行 讨论 。 


1.3.1 系统 分 析 ,定义 接口 


1. 分 析 必 须要 有 书面 的 结果 

系统 分 析 就 是 对 所 要 设计 的 任务 做 仔细 分 析 , 分 析 它 需要 实现 的 功能 。 首 先是 抓 住 主体 
功能 ,同时 尽 可 能 考虑 细节 方面 的 需求 ,力求 在 最 初 设计 时 考虑 周全 。 

在 系统 分 析 的 同时 ,开发 者 应 该 在 心目 中 形成 宏观 上 的 流程 框图 ,定义 这 部 分 功能 模块 ， 
为 整个 系统 提供 的 服务 。 

系统 分 析 或 模块 分 析 是 非常 重要 的 ,但 如 果 只 有 分 析 , 没 有 接口 定义 ,没有 功能 框图 ,没有 
文档 记载 ,而 只 是 在 头脑 中 分 析 , 那 就 不 能 叫做 分 析 。 必 须 记 住 , 分 析 必 须 用 具体 的 形式 表现 
出 来 。 

更 进一步 ,如 果 只 有 主体 分 析 ,头脑 中 想 出 一 个 点 子 , 就 开始 唑 哗啦 啦 裔 键盘 ,编写 程序 ， 
那样 的 做 法 对 于 系统 设计 是 非常 危险 的 。 

总 之 ,强调 一 点 ,一 定 要 有 分 析 , 分 析 要 全 面 , 要 透彻 ,要 写 文档 ,要 定义 完整 的 接口 。 定 义 
接口 可 以 帮助 整理 思路 ,有 了 好 的 实现 方案 ,具体 实现 的 时 候 就 不 会 走 弯路 ,即便 偶然 走 弯路 ， 
也 可 以 对 照 文 档 扭 转 过 来 。 因 此 ,文档 是 指示 图 ,有 了 设计 完整 的 文档 ,程序 实现 就 一 定 会 简 
化 、 高 效 。 
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2. 接口 及 其 定义 

所 谓 接口 ,就 是 对 一 个 外 部 需要 调用 函数 的 完整 定义 。 

一 个 模块 设计 中 有 很 多 局 部 函数 ,它们 在 这 个 模块 内 使 用 ,功能 很 简单 ,对 重要 模块 的 实 
现 起 辅助 作用 。 对 局 部 函数 功能 的 定义 可 以 放 在 次 要 位 置 。 

与 局 部 函数 相对 应 ,一 个 模块 的 设计 中 ,总 有 一 个 或 多 个 函数 ,或 数据 结构 是 为 外 部 其 他 
模块 所 设计 的 ,否则 这 个 模块 就 是 无 用 模块 。 那 么 对 于 外 部 调用 所 设计 的 函数 ,必须 写 清楚 它 
们 的 输入 /输出 参数 .参数 类 型 .参数 范围 及 限制 。 这 就 是 所 要 讨论 的 接口 。 

在 一 个 模块 的 实现 中 ,一 定 要 分 清 外 部 要 调用 的 函数 和 内 部 局 部 使 用 的 函数 。 一 般 地 ,一 
个 或 多 个 “C? 源 文件 (例如 * . c) ,会 有 一 个 专门 的 头 文件 (例如 “xx. h”) 来 定义 这 些 接口 。 建 
议 把 这 些 外 部 调用 接口 按 功能 集中 放置 在 这 个 头 文件 里 。 对 于 那些 局 部 调用 函数 的 声明 ,也 
应 集中 放置 ,或 放 在 这 个 头 文件 之 后 ,或 置 于 实现 源 文件 的 开始 部 分 ,或 单列 一 个 专用 的 头 文 
件 。 后 者 的 好 处 是 使 得 头 文件 更 清晰 可 读 ,外 部 功能 明显 , 仅 把 多 个 源 文件 需要 使 用 的 函数 置 
于 公用 头 文 件 中 。 

为 了 保持 头 文件 的 干净 .可 读 , 头 文件 的 接口 声明 一 定 要 加 上 简短 的 注释 ,而 对 一 系列 功 
能 加 以 集中 注释 ,就 是 说 ,注释 完 一 系统 接口 函数 的 功能 后 ,再 列 出 这 些 函 数 的 原型 ,而 把 一 个 
外 部 函数 的 完整 接口 定义 作为 注释 部 分 放置 于 实现 函数 的 头 部 之 上 。 

需要 说 明 两 点 : 

@ 这 些 注释 只 是 接口 定义 在 代码 中 的 一 个 快照 ,完整 的 接口 定义 应 用 放置 于 程序 的 设计 
文档 之 中 。 

@ 外 部 调用 函数 需要 接口 注释 ,内 部 局 部 使 用 函数 的 注释 仍然 非常 必要 。 要 养 成 写 注 释 
的 习惯 ,除非 这 个 函数 非常 简单 明了 。 

接口 的 定义 还 体现 在 模块 之 间 的 功能 和 调用 逻辑 关系 都 很 清楚 。 如 果 模 块 甲 中 的 所 有 函 
数 都 只 能 被 模块 乙 调 用 ,这 种 关系 相对 简单 ,而且 从 层次 上 来 说 ,模块 甲 为 模块 乙 提供 服务 ,可 
以 把 模块 甲 放 在 模块 乙 的 下 层 。 如 果 模 块 甲 与 模块 乙 之 间 存 在 相互 调用 关系 ,这 个 时 候 可 以 
认为 它们 属于 同一 层 , 彼 此 之 间 没有 服务 的 关系 。 如 果 两 个 模块 存在 相互 的 调用 关系 ,又 存在 
提供 服务 的 关系 , 则 是 既 处 在 同 层 又 处 在 上 下 层 , 这 种 情况 就 要 非常 小 心 。 对 于 这 种 情况 ,一 
般 认 为 ,这 两 个 模块 的 划分 存在 问题 ,除非 迫不得已 ,应 当 避 免 两 个 模块 之 间 同 时 存在 上 下 层 
以 及 同 层 关 系 。 

对 于 同 层 的 关系 ,由 于 它们 相互 之 间 存 在 调用 关系 ,有 些 例 程 可 能 在 这 里 实现 ,也 可 能 在 
那里 实现 ,还 可 能 在 两 处 同时 实现 ,这 种 情况 就 需要 有 精细 的 系统 分 析 与 接口 定义 ,这 也 是 系 
统 分 析 的 主要 任务 之 一 。 


1.3.2 函数 实现 ,优化 算法 
下面 通过 几 个 实际 例子 来 说 明 算法 对 于 嵌 人 式 软件 设计 的 重要 性 ,以 及 如 何 实现 与 优化 。 
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这 里 首先 交待 一 下 代码 风格 方面 应 注意 的 问题 : 

全 使 用 易 读 的 缩 略 单词 ,而 不 是 使 用 完整 的 短 句 。 例 如 : 

audio_reader_buffer_upper_half_full_flag = 15; 

audio_reader_buffer_1ower_half_full_flag = 0; 

虽然 容易 明白 意思 ,但 是 很 难 记 , 不 便于 检查 笔 误 ,而 且 整 个 源 文件 全 是 一 大 串 一 大 串 参 
差 不 齐 的 英文 短 句 ,可 读 性 反而 降低 。 不 如 写成 : 


rbuff_flagl = BUFF_FULD; //flagl: upper half 
buff_flag2 = BUFR_EMPTY; //flag2: lower half 
这 样 可 读 性 就 提高 了 不 少 。 

其 他 例子 如 : 

drv 一 arivers; dev 一 device; Id->ITead; 
WwWt-> Wite ptr->Pointer; msg-~meSsage; 
Sem-”>Semaphore; C]k-~>C1ock; adr 一 ~addressy 
id->identiftiier; init->initialization 

使 用 缩 略 语 时 要 注意 : 


国 不 要 随时 变更 ,应 该 保持 统一 风格 ,如 不 能 一 会 儿 写 driv ,一会儿 写 drv; 或 者 一 时 用 
adr, 一 时 用 addr, 一 时 又 用 adrs。 最 好 是 在 整个 团队 形成 统一 的 风格 , 列 出 一 个 字 
典 表 。 

一 尽量 用 辅音 字母 。 

@ 函数 名 大 小 写 ,或 是 否 使 用 分 隔 符 ,其 风格 要 一 致 。 

@ 作为 接口 定义 的 一 部 分 ,在 头 文件 中 ,要 定义 好 常量 .数据 结构 .外 部 函数 调用 的 接口 
以 及 模块 内 部 多 个 源 文件 需要 使 用 的 函数 等 ,要 养 成 良好 的 习惯 。 

应 该 对 常量 定义 加 以 说 明 ,说 明 每 个 常量 ,每 个 字段 的 意义 。 对 于 数据 结构 的 定义 ,也 要 
对 每 个 字段 加 以 说 明 ,说 明 其 用 途 , 必 要 时 说 明 其 取 值 范围 。 

注意 :数据 结构 是 接口 的 重要 部 分 ,是 整个 模块 设计 的 骨架 之 一 。 在 定义 一 个 新 的 数据 结 
构 时 ,必须 尽量 考虑 周全 。 结 构 如 同 模块 定义 一 样 ,定好 之 后 一 般 不 要 随意 修改 。 结 构 定 义 之 
前 一 定 要 有 注释 说 明 。 

在 函数 的 实现 中 ,算法 的 优化 是 相当 重要 的 。 对 于 算法 ,很 多 初学 者 都 存在 一 个 误区 , 即 
认为 数值 计算 里 讲 的 算法 ,或 者 DSP 处 理 中 的 计算 优先 才 叫 算法 ,实际 上 ,软件 策略 同样 也 是 
算法 。 如 调试 算法 ,存储 器 替换 算法 ,它们 实际 上 是 一 些 策 略 ,是 指 一 些 对 于 事务 处 理 的 方法 
与 步骤 。 也 就 是 说 ,程序 设计 中 的 算法 是 广义 的 , 既 包 括 计算 方法 中 涉及 的 算法 ,还 包括 音 视 
频 处 理 的 变换 方法 所 使 用 的 算法 ,在 程序 的 实现 、 循 环 . 绒 套 、 同 步 .数据 结构 的 设计 和 模型 的 
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建立 等 方面 ,无 一 不 体现 算法 。 

所 谓 程序 的 算法 优化 ,其 目标 不 外 乎 有 两 个 :一 是 优化 运行 时 间 ( 动 态 的 ) ,二 是 优化 代码 
的 存储 空间 (静态 的 ) 。 即 一 个 是 时 间 上 的 优化 , 另 一 个 是 空间 上 的 优化 。 其 表现 结果 是 ,占用 
的 内 存 空间 小 ,运行 速度 快 。 如 果 能 同时 兼顾 两 者 ,这 种 算法 一 定 是 最 优越 的 。 但 是 往往 时 间 
和 空间 不 能 兼顾 ,于 是 需要 对 二 者 进行 平衡 ,适当 取舍 。 

在 考虑 算法 优化 对 时 间 和 空间 影响 的 情况 下 ,同样 要 兼顾 代码 的 可 读 性 和 通用 性 。 对 于 
一 个 奇特 的 算法 , 它 的 实现 往往 是 辅 以 人 的 智慧 人 的 思考 于 程序 ,在 这 种 情况 下 ,程序 的 注释 
就 显得 尤为 重要 。 


1.3.3 清理 代码 ,补充 注释 


这 一 部 分 工作 主要 是 在 程序 设计 的 后 期 阶段 对 代码 进行 完善 和 整理 。 例 如 : 

中 对 代码 进行 局 部 优化 ,如 改变 循环 体 的 结构 ,局 部 变量 初始 化 的 设置 ,合并 类 似 的 分 
支 , 提 取 公 用 代码 作为 一 个 独立 函数 ,优化 算法 结构 等 。 

G@O 删除 无 用 的 局 部 变量 , 复 用 一 些 局 部 变量 ,修改 代码 ,使 之 看 起 来 干净 .整洁 。 

鲜 补充 注释 ,增强 代码 的 可 读 性 。 


1.3.4 测试 修订 ,完善 文档 


程序 设计 后 期 ,需要 对 所 设计 的 程序 进行 调试 和 修改 ,增加 完善 的 功能 。 系 统 软件 的 设计 
需要 与 其 他 模块 互动 。 在 早期 设计 中 ,要 测试 单一 模块 的 功能 比较 困难 ,需要 设计 人 员 创 造 性 
地 设计 一 些 案 例 来 进行 模拟 测试 。 例 如 把 一 些 外 部 调用 做 成 一 些 空 函 数 实现 ,以 此 来 割裂 模 
块 之 间 的 牵连 。 

其 次 是 完善 文档 ,其 重要 性 已 经 反复 强调 了 很 多 次 。 文 档 的 内 容 包括 :模块 实现 功能 的 描 
述 与 清单 ,系统 中 的 位 置 及 交互 关系 ,系统 框图 ,接口 的 定义 ,实现 算法 ,各 个 主要 函数 的 实现 
描述 ,最 后 还 应 该 包括 编译 环境 测试 步 又 以 及 相应 的 现象 。 


上 4 程序 实例 剖析 _ 


EN 寺 RE 


下 面 以 正 、 反 两 方面 的 例子 来 说 明 如 何 编写 性 能 稳定 的 程序 ,以 及 程序 设计 中 的 某 些 注意 
点 。 虽 然 所 举 的 只 是 一 些 简单 的 程序 设计 例题 ,但 是 在 分 析 中 ,将 逐步 涉及 敌人 式 设 计 领 域 里 
一 些 实质 性 概念 ,这 有 助 于 读者 理解 程序 的 实质 ,有 助 于 程序 员 提 高 在 嵌 人 式 软 件 方面 的 程序 
设计 能 力 。 


1.4.1 正确 理解 栈 
本 小 节 通 过 一 个 实际 例子 来 说 明正 确 理解 栈 的 问题 ,由 于 没有 正确 理解 栈 ,一 些 软件 工程 
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师 在 程序 设计 中 容易 出 现 “ 内 存 泄 漏 ?之 类 的 问题 。 

[问题 ] 系统 在 处 理 环境 变量 ,或 处 理 一 个 程序 的 输入 参数 ,或 作 一 些 字 处 理 的 程序 中 ， 
常常 需要 从 一 个 字符 串 序列 中 提取 一 个 单词 ,这 些 单词 可 能 由 空格 或 Tab 键 之 类 的 空白 字符 
分 隔 开 。 为 此 ,设计 一 个 取 名 为 getword 的 函数 。 

对 于 这 样 一 个 函数 ,首先 应 该 思考 一 下 它 的 接口 (API) ,也 即 函 数 的 原型 。 希 望 它 返回 指 

向 第 一 个 单词 的 指针 , 除 此 之 外 ， 人 

经 过 这 番 分 析 ,可 以 写 出 这 样 一 个 接口 


Char * getword (char x* jnp); 


现在 来 看 看 一 位 程序 员 的 实际 设计 方法 ; 
设计 (一 ): 
井 define STRLEN 1024 


Char x* getword (char *x* in_p) 
{ 
char xp， wordLSTRLEN]; 
int 了 
B = xin_p; 
while(xp1= ) 
word[Li++] = xp++s 
word[Li] = 
in_p = &p+1; 
Teturn word; 
} 
[点 评 ] 函数 内 部 使 用 的 数组 是 在 线程 的 “ 栈 ? 上 分 配 的 ,一 个 线程 所 能 支配 的 栈 空 间 很 
有 有限。 如 果 函 数 内 部 使 用 的 空间 较 大 ,可 以 把 它 放 在 函数 外 部 ,作为 一 个 全 局 的 变量 ,这 样 , 它 
将 被 分 配 到 数据 段 中 。 后 者 的 缺点 是 如 果 在 程序 的 整个 运行 期 间 , 它 将 占用 内 存 ; 前 者 的 缺点 
是 如 果 在 程序 内 部 使 用 大 量 的 局 部 变量 (数组 ), 可 能 将 导致 栈 被 溢出 。 


初 看 起 来 ,这 个 设计 似乎 不 错 , 它 将 第 一 个 单词 复制 到 了 一 个 字符 数组 中 ,然后 返回 了 指 
向 这 个 字符 数组 的 指针 。 同 时 修改 了 随后 要 处 理 的 字符 串 的 指针 

仔细 分 析 一 下 却 会 发 现 ,这 个 字符 数组 的 数据 空间 是 分 配 在 栈 (stack) 中 , 当 函 数 返回 时 ， 
这 块 区 域 将 被 < 释放”。“ 释 放 ” 加 上 引号 并 不 是 说 随后 的 使 用 就 得 不 到 正确 的 数据 ,因为 它 还 
存在 于 内 存 中 ,而且 就 在 当前 栈 指 针 临 近 的 区 域 ,所 以 这 个 时 候 如 果 调用 函数 ,采取 一 些 措 施 ， 
是 可 以 获得 这 个 数据 单词 字符 串 的 。 但 是 当 这 个 函数 返回 而 没有 使 用 返回 的 结果 之 前 ,又 进 
一 步调 用 别 的 函数 ,例如 打印 ,或 别 的 处 理 函 数 时 ,新 调用 的 函数 会 重复 使 用 前 次 函数 调用 时 
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的 栈 区 域 , 所 以 极 有 可 能 在 本 次 调用 的 过 程 中 ,把 上 次 函数 调用 中 的 数据 破坏 掉 了 。 

事实 上 ,除非 是 在 调用 该 函数 之 后 立即 将 这 个 字 串 复制 走 , 和 否则 ,如 果 中 间 插 入 别 的 函数 
调用 , 则 内 存 中 的 那 片 数据 就 可 能 被 破坏 。 

这 个 设计 中 的 另 一 个 不 足 之 处 是 :在 函数 内 部 使 用 了 一 个 非常 大 的 局 部 变量 数组 ,这 是 非 
常 危 险 的 。 因 为 局 部 变量 是 在 栈 上 分 配 的 ,而 系统 给 一 个 线程 所 分 配 的 栈 的 大 小 是 相当 有 限 
的 ,目的 在 于 系统 中 可 能 同时 运行 了 很 多 线程 ,它们 都 将 占用 嵌 人 式 设 备 里 有 限 的 内 存 , 所 以 
大 数量 的 内 存 需 要 动态 请 求 ,否则 会 导致 栈 的 溢出 。 栈 的 溢出 意味 着 这 个 程序 会 读 / 写 数据 到 
其 他 程序 所 占用 的 物理 存储 空间 。 

初学 者 容易 犯 这 样 错 误 的 原因 在 于 对 栈 的 理解 不 深刻 。 可 能 只 是 记 住 了 栈 “ 后 进 先 出 ”的 
工作 原理 ,而 忽略 了 栈 的 其 他 一 些 特 性 ,例如 ,在 物理 实现 上 有 一 个 栈 限 的 限制 ,在 函数 调用 过 
程 中 用 来 传递 参数 ,在 函数 内 部 用 作 临 时 工作 区 域 。 栈 在 线程 运行 的 过 程 中 是 会 不 断 重复 使 
用 的 ,一 次 函数 调用 将 分 配 一 段 内 存 区 , 当 这 个 函数 退出 (返回 ) 时 ,这 段 临时 区 将 被 全 部 收回 。 
某 些 CPU 有 栈 限 检测 的 指令 ,这 将 导致 一 个 异常 。 如 果 未 对 这 种 异常 正确 处 理 , 或 没有 进行 
检查 , 那 就 有 可 能 因 细小 的 朴 忽 而 导致 整个 系统 的 出 错 或 瘫 病 。 一 些 编译 器 也 会 在 编译 时 进 
行 一 些 检查 ,但 栈 的 使 用 有 时 是 在 运行 的 时 候 才 确定 的 ,这 些 情况 下 ,编译 器 无 法 发 现 和 报告 
错误 。 由 此 可 见 , 深 入 理解 程序 结构 非常 重要 。 

另外 ,这 个 设计 没有 对 i 进行 初始 化 ,这 也 是 十 分 危险 的 。 因 为 ji 是 一 个 局 部 变量 , 它 是 在 
栈 中 临时 分 配 的 ,其 初始 数据 完全 取决 于 上 次 使 用 时 所 保留 的 值 。 如 果 这 个 值 非 常 大 , 极 有 可 
能 word[i 访 问 到 一 个 非法 区 域 或 内 存 中 并 不 实际 存在 的 区 域 时 ,将 会 导致 非法 访问 (无 权 
限 ), 由 此 会 产生 一 个 数据 异常 (data abort) 的 错误 。 

下 面 来 实际 运行 一 下 这 个 程序 ,看 得 到 什么 结果 ,完整 的 程序 清单 如 下 ， 


FEiley， test1.C 
兴 关 关 关 关头 关 其 关 凑 凑 关 关 其 关 凑 浴 关 其 关 关 凑 凑 关 关 关 关 关 关 关 并 凑 其 关 次 


井 define STRERN 1024 


Char x* getword (char xx in_p) 
{ 
char  *p， wordLSTRLEN] ; 
int 工 ; 
P = # jin_p; 
while(xp1=“ ) 
word[Li++] = xpP++， 
wordLi] = “0 
inp = S&p+1; 


return word; 
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} 


char str[] = "Lily is a new student"; 
int main(》 
{ 
char x* Pp=Str,，x pl1; 
DBPrintf(" 一 书 S> contains following words:Nn" ,p); 
whileCxP1= 0){ 
p1 = getword(Sp); 
if(p1 == 0 || *pP == 八 0") break; 
printf("% sSN\n" ,pl); 
} 


return 0; 


} 
在 GCC 环境 下 对 这 个 文件 进行 编译 : 


$ gcc testl.c -ol1.out 
test1.c:， In function“getword”: 


test1.c:19:，warning: function returns address of Local-variable 


在 编译 结果 中 可 以 看 到 一 个 警告 (warning) ,说 明 这 个 程序 的 设计 是 有 问题 的 。 经 过 上 面 
的 分 析 , 这 个 Warning 实际 上 对 整个 系统 有 潜在 的 危险 。 所 以 ,读者 以 后 在 编译 程序 的 过 程 
中 遇 到 Warning 时 ,不 要 随意 放 过 。 记 住 ,现在 是 在 设计 系统 程序 的 一 部 分 ,一 定 要 对 自己 高 
标准 、. 严 要 求 。 

由 这 个 例子 可 以 看 出 ,在 程序 设计 中 ,一 定 要 精益 求 精 ,即使 在 编译 链接 的 时 候 只 是 预告 
了 一 个 警告 ,也 很 可 能 存在 一 个 非常 重大 的 潜在 危害 。 

小 结 : 

在 这 个 例子 中 ,设计 者 没有 实质 理解 “ 栈 ” 的 概念 。 一 般 教 材 上 所 讲 的 “ 栈 是 一 块 先进 后 
出 的 内 存 区 域 ,由 此 可 以 使 用 POP - PUSH 的 方式 来 存 取 , 但 是 “ 栈 除 了 可 以 使 用 此 方法 来 
保存 数据 之 外 ,还 可 以 用 作 函 数 的 临时 工作 区 域 。 函 数 体 内 的 局 部 变量 就 是 在 线程 所 在 的 
“ 栈 ” 里 分 配 的 ,而 局 部 变量 的 指针 不 外 乎 是 一 个 32 位 的 指针 ,或 者 说 是 一 个 “整形 数 ”, 它 可 能 
存放 于 一 个 通用 寄存 器 中 ,也 可 能 是 栈 所 在 区 域 的 一 个 内 存 变 量 。 在 许多 RISC 架构 里 ,没有 
POP -PUSH 这 样 的 指令 ,对 于 栈 的 操作 完全 是 “手动 的 ”, 需 要 程序 员 使 用 Load - Store 的 指 
令 来 存 取 数据 ,使 用 对 栈 指 针 执 行 减 的 操作 来 为 一 个 函数 预 留 一 帧 (frame) ,在 该 帧 里 保存 所 
有 要 保护 的 数据 .参数 的 传递 以 及 临时 变量 在 存储 空间 的 分 配 ; 使 用 对 栈 指针 执行 加 的 操作 来 
出 栈 , 以 恢复 进入 函数 之 前 的 栈 指针 的 值 。 出 栈 之 后 ,新 的 函数 被 调用 时 ,如 果 需 要 保留 数据 、 
传递 参数 或 使 用 临时 变量 ,C 编译 器 或 汇编 程序 员 需 要 对 栈 指针 执行 上 述 的 减 和 加 的 操作 来 
使 用 栈 。 


汪 ， ， 


AS 
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由 此 看 来 ,在 一 个 线程 中 , 栈 是 函数 调用 时 被 循环 使 用 的 ,一 个 函数 调用 ,将 在 栈 中 分 配 一 
帧 的 空间 。 如 果 这 个 函数 调用 子 函 数 , 则 需要 在 栈 上 邻接 这 一 帧 的 位 置 分 配 另 外 的 空间 ( 帧 ) 。 
不 同 的 系统 帧 的 增长 方向 不 同 ,有 的 系统 向 上 生长 ,有 的 系统 向 下 生长 。 不 同 的 系统 允许 函数 
藤 套 的 层 数 也 不 相同 。 在 退出 一 层 函 数 的 时 候 , 栈 指 针 被 恢复 到 进入 这 个 函数 之 前 的 栈 指针 
的 值 。 如 果 这 两 个 值 不 相同 , 则 产生 整个 线程 的 运行 错误 ,导致 这 个 进程 运行 不 正确 ,严重 时 
甚至 可 能 破坏 整个 系统 。 栈 的 用 途 是 用 来 保存 一 些 数据 ,一 些 寄存 器 的 值 , 或 进行 参数 的 传 
递 ,或 分 配 函 数 体内 所 使 用 的 临时 变量 。 

特别 说 明 ,在 这 里 ,我 们 把 一 个 函数 所 使 用 的 栈 的 空间 , 即 一 个 函数 的 一 次 调用 所 使 用 的 
那 部 分 栈 上 分 配 空间 叫做 一 帧 (frame) 。 

在 这 个 例子 中 ,虽然 getword( ) 返 回 的 指针 由 调用 函数 可 以 获得 ,但 是 在 调用 printf( ) 时 
栈 里 的 值 被 压 和 新 的 寄存 器 存储 值 ,或 分 配 作为 新 的 临时 变量 ,所 以 在 printf( ) 调 用 时 得 不 到 
期 望 的 结果 。 


1.4.2 内 存 泄 漏 


内 存 泄漏 是 程序 员 初学 者 常 犯 的 一 个 错误 。 

防止 内 存 泄漏 的 一 个 重要 原则 就 是 在 什么 地 方 申请 就 在 什么 地 方 释放 ,系统 里 其 他 资源 
的 使 用 也 是 一 样 。 包 括 文件 打开 描述 符 . 锁 、 信 和 号 量 和 线程 等 ,都 要 执行 在 什么 地 方 申请 就 在 
什么 地 方 释放 的 原则 。 跨 越 访问 点 ,分 离 申 请 与 释放 都 容易 出 现 朴 忽 , 从 而 导致 重大 错误 。 

内 存 港 漏 类 似 问 题 的 直接 后 果 就 是 系统 表面 看 起 来 没有 毛病 ,但 随 着 时 间 的 推移 ,系统 的 
资源 慢 慢 地 被 耗 尽 ,或 造成 访问 的 越界 ,从 而 引起 系统 的 随机 衣 省 。 


1.4.3 消除 编译 依赖 
对 于 同一 个 设计 任务 ,看 看 另 一 位 设计 师 的 实现 是 否 符合 要 求 。 
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设计 (二 )， 
井 define WORDLEN 256 
typedeft 。 struct  《 
Char 关 了 ; 
int 1enj 
) WORD; 


WORD getword (char *x in_p) 
{ 
Char < 关 Pp，# ptmp; 
WORD W 
ptmp = (char x* ) malloc (WORDLEN) ; 
w-p = ptmpi; 
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P = *in pi 
while(xp1=-  ) : 

关 PtmpT+ = 关 P++ys 
x ptmp = 0 
inp = S&p+1l; 
w, Jen = ptnmp - w.Ppi; 
Teturn  W; 


} 


当 看 到 这 个 设计 时 会 感觉 比较 新 奇 ,第 一 反应 是 它 返 回 了 一 个 64 位 数 。 这 个 程序 也 许 在 
某 些 系统 中 也 确实 能 工作 ,但 是 在 大 多 数 RISC 体系 中 , 却 得 不 到 正确 的 结果 ,或 者 说 得 不 到 
期 望 的 结果 。 

下 面 来 分 析 一 下 程序 工作 时 的 内 部 机 制 : 

通常 情况 下 ,结构 常常 用 指针 来 传递 ,当然 也 有 传 值 的 ,面向 对 象 的 高 级 语言 常常 会 这 样 
做 。 但 深入 理解 高 级 语言 实质 的 程序 员 会 知道 所 谓 传 值 实际 上 传递 的 是 引用 。 所 谓 的 引用 ， 
只 不 过 是 高 级 语言 的 编译 器 复制 了 所 需要 的 内 容 到 新 的 地 址 空间 。 这 些 工作 是 隐 含 的 ,程序 
员 看 不 见 , 也 没有 想到 ,所 以 高 级 语言 的 程序 员 在 编写 舱 人 式 软件 时 需要 更 加 细致 。 

在 C 十 十 里 引入 了 类 的 概念 ,引入 了 运算 符 重 载 ,所 以 才 可 以 轻松 自如 地 使 用 诸如 “一 ” 
这 样 的 重 载运 算 符 。 对 于 诸如 双 精 度 浮 点 或 64 位 长 整数 ,如 果 编 译 器 不 支持 的 数据 类 型 , 诸 
如 结构 或 类 ,那么 必须 得 重 载 这 些 运 算 符 。 有 些 编译 器 对 于 结构 类 型 作 了 扩展 ,对 于 值 传递 的 
参数 或 返回 值 , 编 译 器 会 自动 执行 一 些 额 外 的 复制 ,所 以 在 这 种 环境 中 ,程序 可 以 正常 运行 。 
然而 不 会 总 是 那么 幸运 ,大 多 数 编译 器 并 不 支持 这 种 额外 的 复制 ,也 不 作 这 种 假定 , 它 只 会 按 
照 RISC 体系 ,返回 一 个 32 位 整数 ,从 而 把 高 位 的 一 部 分 给 截 掉 了 。 

这 位 程序 员 估计 是 C 十 十 程序 写 得 太 多 了 ,但 是 当 转 和 人 到 藤 人 式 软件 设 计时 ,一 定 要 清楚 

一 ”的 原理 和 由 来 ,否则 就 不 能 再 用 高 级 语言 的 思想 来 写 嵌 人 式 的 底层 软件 。 要 人 么 是 扔 掉 高 

级 语言 的 思维 模式 ,要 么 是 继续 开发 面向 对 象 的 应 用 程序 。 

事实 上 ,上 面 的 两 个 设计 不 是 我 凭空 脐 造 出 来 的 设计 ,它们 都 是 有 好 几 年 戏 人 式 软 件 工作 
经 验 的 工程 师 所 写 的 程序 ,而 且 还 是 从 中 挑 出 来 的 .比较 好 的 实现 ,所 以 我 们 一 定 不 要 过 高 地 
估计 自己 的 程序 设计 能 力 。 

从 这 个 例子 中 ,要 意识 到 : 

敌人 式 系 统 软件 给 程序 员 带 来 了 挑战 , 它 不 但 要 求 程序 员 会 写 程序 ,更 要 求 程序 员 懂 得 程 
序 运行 的 每 一 个 步骤 的 机 理 , 从 而 才能 正确 控制 程序 的 执行 。 这 也 是 为 什么 很 多 人 、 很 多 团队 
或 很 多 公司 写 出 的 软件 不 稳定 的 根源 。 

除了 会 写 程序 ,还 需要 深入 分 析 一 个 程序 的 工作 状况 ， 弄 清 楚 程序 的 工作 原理 和 机 制 ， 破 
除 想当然 的 腌 想 观念 ,力求 稳定 的 实现 。 即 在 所 有 的 开发 平台 ,所 有 的 编译 工具 下 ,程序 都 可 
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以 正常 运行 。 所 以 一 个 优秀 的 系统 程序 员 应 该 知道 程序 工作 的 正确 原理 ,而 不 应 该 想当然 ,不 
应 该 增加 对 编译 器 或 系统 的 依赖 ,这 样 才能 使 程序 有 做 到 更 好 的 容错 性 和 健壮 性 。 减 少 依赖 
最 好 的 办 法 就 是 使 用 简单 .直接 或 原始 的 工具 。 人 身上 最 简单 .最 原始 的 工具 就 是 手 , 手 是 最 
灵活 也 最 适用 的 。 写 程序 最 简单 .最 直接 的 工具 就 是 汇编 语言 。 作 为 骨 入 式 软件 设计 的 工程 
师 , 花 一 些 时 间 去 铬 研 汇编 程序 的 设计 是 有 助 于 提高 自己 程序 分 析 及 设计 能 力 的 。 

之 所 以 要 强调 这 一 点 ,是 因为 类 似 的 设计 在 一 些 系 统 设 计 中 是 会 出 现 的 。 有 一 次 我 在 移 
植 一 个 Firmware 时 ,就 遇 到 了 类 似 的 麻烦 。 一 个 程序 在 一 个 系统 中 工作 得 非常 好 ,但 在 另 一 
个 编译 器 重新 编译 后 , 换 了 一 个 平台 却 无 法 工作 。 系 统 程序 都 是 很 庞大 的 ,跟踪 下 来 终于 发 
现 , 它 定义 了 Terminal 结构 ,程序 里 面 使 用 了 大 量 的 类 似 赋 值 , 结 果 , 把 相关 的 地 方 用 mem- 
cpy 全 部 替换 后 ,程序 就 可 以 正常 工作 了 。 


1.4.4 ”消除 潜在 隐患 


这 个 设计 还 有 很 多 不 足 之 处 。 首 先是 在 函数 的 内 部 动态 分 配 了 一 块 内 存 作 为 缓冲 ,初学 
者 在 软件 设计 中 容易 引起 内 存 泄漏 的 一 个 重要 原因 就 是 在 分 配 内 存 时 很 随意 ,没有 考究 内 存 
在 什么 地 方 释放 ,或 释放 的 路 径 不 够 全 面 。 如 果 这 是 一 个 系统 函数 ,并 且 跨 越 了 进程 的 边界 
时 ,问题 会 更 加 严重 ,因为 不 同 的 进程 所 看 到 的 内 存 映 象 是 不 一 样 的 。 我 们 知道 , 库 函 数 的 标 
准 设计 应 该 是 纯 的 过 程 函数 ,对 可 重 人 男 数 的 要 求 是 不 能 有 静态 数据 ,这 种 在 一 个 模块 内 分 配 
内 存 ,出 现在 另 一 个 模块 内 释放 的 操作 ,是 不 规范 的 操作 , 它 给 外 部 加 了 一 些 限 制 ,最终 的 后 果 
是 导致 出 现 内 存 泄 漏 这 样 的 隐患 ,或 者 是 让 一 个 外 部 模块 的 调用 者 必须 看 懂 这 个 模块 内 部 所 
有 的 设计 缺陷 之 后 才能 正常 地 调用 这 个 模块 内 的 函数 。 

其 次 是 没有 对 参数 进行 检查 ,传人 的 参数 是 一 个 指向 字符 串 指针 的 指针 ,正确 的 做 法 是 首 
先 检查 inp 是 否 等 于 0, 这 还 不 够 ,应 该 更 进一步 检查 * inp 是 否 等 于 0。 

对 于 系统 程序 的 设计 来 说 ,不 检查 参数 是 一 个 致命 的 弱点 。 当 然 对 于 自己 写 的 函数 自己 
用 的 情形 ,如 果 足 够 细心 ,总 能 按 自己 设想 的 方法 去 调用 这 些 函 数 , 并 传人 正常 形式 的 参数 。 
但 在 实际 项 目 开 发 过 程 中 ,设计 者 在 某 一 个 地 点 设计 了 一 个 库 函数 ,而 使 用 者 却 有 可 能 在 世界 
的 另 一 个 角落 。 设 计 者 没有 办 法 控制 库 函 数 的 使 用 者 如 何 调用 这 个 函数 ,因此 应 该 在 接口 函 
数 的 文档 中 给 出 这 种 限制 的 明确 描述 ,由 此 也 说 明 应 用 编程 接口 (API) 文 档 的 高 度 重要 任 。 
尽管 如 此 ,如 果 一 个 应 用 程序 员 的 微小 疏忽 就 会 导致 整个 系统 的 崩溃 ,这 是 系统 程序 员 决 不 应 
该 看 到 的 事情 ,因此 系统 程序 必须 有 高 度 的 容错 性 ,这 要 求 系统 程序 员 时 时 刻 刻 都 要 留心 自己 
所 做 的 每 一 件 工作 。 

最 后 一 个 问题 是 ,如 果 字 符 串 的 分 隔 之 处 出 现 多 个 空格 , 则 在 返回 的 字符 串 单 词 的 前 面 可 
能 会 有 多 个 引导 空格 ,这 也 不 是 所 希望 的 。 除 此 之 外 ,还 有 可 能 有 别 的 分 隔 字 符 。 所 以 这 个 函 
数 不 是 一 个 完美 的 函数 ,而 且 大 多 数 情况 下 会 导致 不 期 望 的 结果 。 这 个 过 程 有 点 类 做 于 " 归 一 
化 ”。 精 细 的 程序 设计 中 常常 需要 进行 这 种 归 一 化 的 操作 ,从 而 增加 程序 设计 的 通用 性 。 
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1.4.5 规范 实现 范例 
针对 上 面 的 讨论 , 接 下 来 看 一 些 比较 好 的 设计 方案 ， 


char x* getword (char xx inp) 
{ 
char xp， xpdsti 
主 (!1 inp || ! xinp) 
return 〈0); // 检 查 参 数 
P = x#x inp; 
while (isspace (x p)) // 跳 过 前 导 “ 空 格 ” 
PT++， 
if (xp == 0) 
return (0); 
pdst = P; 
While(!1 isspace (xDp) S&& *p1 = 0) 
PT++y 
xp++ = 0i // 标 记 “ 串 ”的 结束 
x inp = Pp; // 调 整 输入 字符 串 的 指针 
return pbdst; 


} 


这 个 函数 的 实现 比较 完整 ,而 且 语句 很 精练 。 它 的 巧妙 之 处 在 于 利用 空白 字符 的 位 置 添 
加 了 一 个 NULL 结束 符 , 由 此 无 需 像 上 面 第 二 种 做 法 那样 需要 一 个 额外 的 长 度 字段 ,指示 这 
个 单词 的 长 度 。 但 由 此 也 带 来 了 不 足 的 地 方 , 它 改变 了 输入 参数 。 处 理 字 符 串 句子 只 被 扫描 
处 理 一 次 (ONE - PASS) 是 没有 问题 的 ,但 如 果 用 户 不 希望 更 改 输入 字符 串 ,而 需要 多 次 处 
理 , 这 个 数 的 设计 仍然 是 不 理想 的 ,必须 复制 所 找到 的 第 一 个 单词 。 

为 此 可 以 重新 设计 接口 ,做 如 下 调整 。 


char x* getword (char x* dst,char *x* S); 


函数 说 明 : 

该 函数 从 一 个 输入 字符 串 “s” 中 提取 第 一 个 非 空白 字符 的 单词 ,返回 指向 这 个 单词 的 
指针 。 

参数 说 明 : 


dst 一 返回 字符 串 的 缓冲 指针 。 调 用 程序 必须 分 配 足 够 的 存储 空间 。 
s 一 输入 源 字 符 串 。 

返回 值 ， 
0 一 没 找到 ,或 输入 参数 错误 。 


aa 
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其 他 一 指向 所 找到 单词 的 指针 。 


Char x* getword (Char x dst,charx P) 
{ 
Char xx ai 
if (! dst | | 1 Dp) return (0); 
dstL0] = 0; 
while(isspace (xp))pP++; 
证 (x*B == 0) return (0); 
a = DB; 
While(! isspace (x*p) && *P1= 0) P++， 
Strncpy (dst,ap 一 a); 
dst[p ~- al = 0; 
Feturn (p); 


} 


现在 看 到 的 是 getword 函数 比较 经 典 的 标准 实现 。 可 以 看 出 它 是 完整 的 ,结构 非常 清晰 
的 ,考虑 问题 很 全 面 。 对 于 空白 字符 ,可 以 提炼 出 一 个 标准 函数 ,因为 用 户 对 于 空白 字符 可 能 
有 不 同 的 限制 与 扩充 。 

在 这 个 设计 中 ,目标 字符 串 的 存储 空间 由 调用 函数 分 配 。 通 常情 况 下 ,调用 函数 能 够 预知 
所 处 理 字 的 最 大 长 度 , 所 以 很 容易 控制 ,无论 是 调用 函数 在 堆 中 分 配 , 还 是 在 栈 上 分 配 ,都 可 以 
由 调用 函 数 负责 处 理 分 配 与 释放 。 调 试 、 修 改 和 维护 都 很 方便 。 | 

函数 首先 检查 输入 参数 ,注意 在 这 里 不 要 用 Assert 宏 ,Assert 宏 只 对 于 调试 版 本 有 效 , 它 
起 到 程序 本 身 检查 的 目的 。 对 于 Release 版 本 ,Assert 宏 并 不 出 现在 目标 代码 之 中 ,如 果 出 现 
Assert 不 能 满足 的 条 件 , 则 程序 将 会 产生 异常 ,甚至 导致 系统 崩溃。 而 如 果 用 户 传 人 不 期 望 
的 参数 ,返回 为 空 ,只 会 导致 本 次 操作 不 成 功 ,并 不 会 将 一 个 地 方 的 错误 扩散 到 整个 系统 中 去 。 

看 了 以 上 的 讨论 之 后 ,读者 也 许 党 得 我 在 这 里 吹 毛 求 症 。 的 确 , 上 面 类 似 的 错误 是 在 所 难 
免 的 ,出 了 这 种 错误 ,可 以 通过 调试 来 跟踪 和 定位 错误 地 点 与 类 型 。 调 试 是 非常 重要 的 ,但 是 
应 该 从 调试 中 不 断 地 总 结 经 验 教 训 , 不 断 地 提高 自己 的 设计 能 力 与 设计 思想 。 如 果 一 个 程序 
的 每 一 个 片段 都 是 通过 反 反 复 复 修改 出 来 的 ,那么 这 个 程序 的 整体 质量 就 可 想 而 知 了 。 

从 上 面 这 个 简单 的 例子 可 以 看 出 ,接口 的 设计 是 非常 重要 的 ,接口 首先 要 考虑 一 个 函数 所 
要 实现 的 功能 ,功能 明确 之 后 ,要 考虑 输入 /输出 参数 以 及 返回 类 型 。 

要 搞 清 楚 程序 的 结构 ,提高 程序 思考 能 力 , 最 好 的 办 法 是 写 汇 编 .C 程序 和 C 十 十 相互 调 
用 的 程序 ,把 C 语言 的 结构 或 类 等 复杂 类 型 传递 到 汇编 中 去 。 这 样 , 可 以 帮助 程序 员 思 考 各 
种 程序 问题 ,也 会 极 大 地 提高 程序 员 对 程序 的 调试 能 力 以 及 控制 能 力 。 
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1.4.6 性 能 优化 


1， 代码 优化 的 必要 性 

由 于 嵌入 式 设 备 的 资源 有 限 ,而且 骨 和 人 式 设备 实时 性 要 求 很 高 ,所 以 内 入 式 软件 设计 中 代 
码 必 须 尽 可 能 优化 。 

另 一 方面 ,简洁 、 完 整 、. 高 效 的 实现 ,更 有 利于 看 清楚 程序 的 结构 ,寻找 程序 中 已 经 实现 和 
未 实现 的 部 分 以 及 外 部 需要 保证 的 部 分 ,从 而 减少 程序 的 错误 ,特别 是 一 个 系统 中 出 现 的 
错误 。 

代码 优化 的 结果 ,也许 会 节省 程序 空间 的 开销 ,或 减少 CPU 的 运行 时 间 。 

2， 代码 优 化 的 方法 一 一 算法 

代码 的 优化 基于 对 问题 的 理解 程度 .解决 问题 的 清晰 思路 与 先进 方法 。 

解决 问题 的 思路 与 方法 都 是 算法 ,因此 应 该 广义 地 理解 算法 。 算 法 不 仅仅 指 音 视 频 计 算 
中 使 用 DSP 进行 优化 的 过 程 ,或 计算 方法 里 的 数值 求 值 ,软件 设计 中 涉及 的 一 些 事务 的 安排 
与 处 理 都 是 算法 。 诸 如 字符 串 比 较 函 数 ,内 存 复制 (memcpy) 函 数 ,中 斯 的 分 配 与 处 理 , 内 存 的 
分 配 与 释放 ,无 一 不 需要 程序 实现 的 策略 ,这些 都 是 算法 。 从 下 面 的 例子 中 可 以 看 到 ,一 种 好 
的 算法 正 是 基于 一 种 简洁 .清晰 的 思路 。 

下 面 以 嵌入 式 软件 工程 师 进 行 测试 时 得 到 的 一 些 回答 作为 实际 例子 ,来 说 明代 码 的 优化 
及 其 重要 性 。 在 这 些 回 答 中 , 绝 大 多 数 结果 都 不 完整 ,看 上 去 面目 全 非 , 因 而 运行 结果 错误 ,或 
根本 不 能 编译 ,只 有 少数 回答 基本 正确 ,但 是 却 非常 繁琐 。 下 面 先 看 一 个 相对 正确 的 回答 。 

[问题 ] 设 计 一 个 例 程 ,在 一 个 给 定 字符 串 中 找 出 最 长 的 .没有 重复 字符 的 字符 串 。 


# include <stdio,.h>> 
void findlongstring(char xx StringyCchar xx Stryint #x Dum) 
{ 


int ij,ki 


Char #P,，xG9， 关 工 eSULt; 
intm= 0; 
char 关 1p; 
iot nj; 
if(#x String== 0 ){ 
xnum=0O; 
x#x Str = Stringy 
工 eturny 
} 
P=9= Stringy 


nn=1; 


} 


GT++; 
while(x*ql= 0) 
《 
for(lp = pilp<Gqylp++) 
if(x 1P == # G) break; 


ifE(lp!= q){ // 找 到 相同 字符 
if(n<<n){ // 找 到 新 的 最 长 字符 串 ,更 新 结果 
丽 =T; 
zesSult = p; 


} 
/* 修改 当前 搜 到 的 字符 串 :起 始 和 数目 * / 
n=q-1lp 一 1; 
pP=1Jlp+1li; 
} 
GT++， 
次 二 + 
》 
if(m== 0) // 长 字符 串 是 字符 串 本 身 
《 
# DuUm = 卫 $ 
x StT = P; 
} 
elSse 
{ 
关 muUm = m; 


x Str = TeSujlt; 


int main() 


{ 


char string[L180] = "asdlkdlabcdefing student output smartabcdefg"; 


int my 

int js; 

Char x Strj 

Char #* TeSult'; 
//fgets(string,180,stdin) ; 
findlongstring(stringy,&stryS&m); 

Tesult = (Char x )malloc(m+1); 

for(Ii= 0;i<<mii++ ) result[i] = str[i]; 
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resultfi] = 人 0 ; 
printf("Nnresult string: 第 S 
length; % dN\n" ,resulty，m); 

} 

这 是 我 从 众多 的 回答 中 选 到 的 几 个 最 好 的 答案 之 一 。 说 它 好 ,只 不 过 因为 它 是 进行 程序 
设计 的 人 在 电脑 上 经 过 反复 调试 得 到 正确 结果 的 一 个 程序 。 

这 段 程序 没有 进行 任何 删 减 和 修改 ,要 看 懂 这 个 程序 ,除非 程序 的 作者 ,可 能 都 要 费 一 些 
周折 ,原因 是 程序 中 没有 有 效 的 注释 。 从 对 齐 结构 上 看 ,层次 很 差 ,可 读 性 不 高 。 在 这 样 一 个 
极其 简单 的 例子 中 ,就 可 以 看 出 程序 注释 的 重要 性 。 

这 里 强调 没有 “有 效 的 ?注释 ,是 指 有 时 虽然 设计 者 加 注 了 一 些 注释 ,但 只 是 一 些 形 式 上 的 
注释 ,没有 进行 整理 和 归纳 ,没有 写 清 实质 思路 或 表述 不 清楚 。 对 于 这 些 注释 ,程序 员 在 编写 
程序 时 ,是 知道 自己 怎么 想 的 ,但 是 只 有 他 自己 知道 ,别人 却 没 法 看 懂 , 时 间 久 了 ,自己 也 会 不 
知 所 云 ,或 要 费 很 大 周折 才能 重新 看 懂 , 这 样 就 严重 影响 开发 效率 。 

程序 中 还 有 一 个 不 完美 的 地 方 , 编 程 者 却 没有 留意 到 , 那 就 是 内 存 的 泄漏 。 内 存 的 泄漏 并 
不 一 定 导致 当前 程序 出 错 , 但 它 会 给 整个 系统 带 来 副作用 ,导致 潜在 的 危害 。 避 免 内 存 泄漏 的 
原则 是 一 旦 动态 分 配 了 内 存 , 就 要 记录 下 来 ,必须 在 不 使 用 或 程序 结束 前 及 时 释放 。 进 一 步 
地 ,必须 在 程序 的 所 有 执行 路 径 (path) 上 都 能 保证 释放 。 

诸如 内 存 泄漏 这 样 的 问题 ,主要 来 源 于 设计 者 马虎 的 个 性 ,考虑 问题 不 严谨 和 不 周密 。 这 
是 我 们 时 时 刻 刻 都 要 细心 留意 的 问题 。 

下 面 看 一 个 规范 的 实现 作为 对 比 。 


井 include "stdio, hy" 
W 兴 兴 闪闪 尖 关 其 关 关 类 关 关 关头 关 尖 其 尖 关 关 并 尖 关 凑 尖 尖 关 关 类 尖 基 闪闪 关 关 闪闪 关 关 并 凑 关 尖 凑 关 关 
函数 目的 ， 
在 一 个 输入 字符 捉 中 搜索 最 长 的 ,没有 重复 字符 的 字符 串 ,结果 保存 在 目标 字符 串 缓冲 中 。 


参数 ， 
src ---~ 输入 源 字符 串 。 
dst --- 输出 目标 字符 串 。 
假定 <dst> 拥 有 足够 长 的 空间 以 存放 搜索 到 的 目标 字符 串 。 
返回 参数 ， 
搜索 到 的 没有 重复 字符 的 字符 串 的 长 度 。 


关 兴 关头 关 关 尖 关 尖 尖 关 尖 关 尖 关 关 关 关 兴 关 关 尖 六 尖 关 尖 关 关 关头 尖 关 关头 关头 关 尖 关头 关 关 凑 关 其 A 
int Searchmaxstr 〈(Const Char x Src， char x dst) 
Int 1Len,,j, start,OStarty,nmaxlens 


Char xp = Src; 
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插 计 (1!src || 1dst || !1src[0]) 
四 return 0; 
式 Start = 0; 
1 OSstart = 0 
设 maxlen = 0; 
计 1 = Start+13 
也 while (pHEi] 1= 0) 
丑 人 
想 for(j = start; j<iy j+t+) 
亿 // maxstr( 最 长 字符 串 ) 
人 了 
人 用 己 
26 M// ~ ~ >、 
// | | | 
// start jj 1 
// 1 | 
// | Dew_start 
// ostart 
// 


证 (PHj] == P[ 订 ) 
{ 
]len = 工 一 Start; 
if (maxlen << len) 
{ 
ostart = startj // 重 新 标记 输出 字符 串 的 起 始 
maxlen = len; 
} 
Start = Jj+1; 
break; 


} 
研 ++ 
} 
len = I- starti // 到 达 输 入 字符 串 的 结尾 
iE (maxlen < len) 
{ 
OStart = Start; // 重 新 标记 输出 字符 串 的 起 始 


maxlen = en; 
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} 

strncpy (dst,&src[ostart],maxlen) ; 
dst[maxlen] = 0; 

Teturn maxlen; 


) 


char tstr[] = "asdlkdlabcdefing student output smartabcdefg" ; 
int mainCvoid) 
{ 

char buff[255]; 

int len; 

len = SearchmaxSstr(tstr,buff); 

Printf(”org: < 必 光 SN\n" ,tstr); 

Printf("len = 5dNn" ,len); 

Printf("result: 忆 区 SNn" ,buff)， 

return 0 


} 


这 个 程序 片段 就 很 清晰 ,一目了然 。 首 先 。 在 函数 的 首部 有 一 个 函数 的 API 描述 ,说 明 
这 个 函数 的 目的 ,用途 和 参数 含义 ,包括 函数 的 输入 、 输 出 以 及 返回 值 。 

用 途 :说 明了 这 个 函数 是 要 找 出 最 长 的 .没有 重复 字符 的 字符 串 。 

函数 的 输入 是 一 个 字符 串 ,包含 在 charx src 里 面 ,而 输出 将 被 复制 到 char * dst 缓冲 区 
里 面 。 在 函数 设计 时 ,初学 者 往往 喜欢 使 用 malloc( ) 动 态 分 配 内 存 , 实 际 上 这 对 于 小 片区 域 
的 内 存 是 不 足 为 取 的 。malloc( ) 与 free( ) 是 系统 调用 ,特别 是 内 存 管理 的 函数 设计 涉及 相关 
的 算法 ,开销 非常 大 。 对 于 小 片区 域 的 内 存 ,使 用 栈 很 方便 。 什 么 是 栈 呢 ? 栈 是 系统 在 启动 一 
个 进程 以 及 一 个 线程 里 会 为 该 进程 和 线程 开辟 一 块 内 存 区 域 , 它 是 程序 (线程 ) 的 临时 工作 活 
动 区 域 。 

调用 函数 将 会 很 容易 知道 dst 的 最 大 长 度 , 因 为 它 不 可 能 超出 src 的 长 度 , 因 此 ,可 以 在 调 
用 函数 一 级 来 预 留 足够 大 的 空间 以 复制 目标 字符 串 。 即 便 是 需要 由 调用 者 来 动态 申请 ,那么 
也 可 以 保证 在 调用 者 申请 的 同 级 释放 ,而 不 是 跨 级 申请 与 释放 内 存 。 

函数 的 主体 部 分 是 在 while( 循环 中 。 设 想 一 下 ,字符 串 中 字符 的 重复 是 如 何 发 生 的 ,从 
头 (start) 开 始 搜索 , 当 搜索 到 第 个 字符 时 ,发 觉 第 [个 字符 与 前 面 第 j 个 字符 相同 (start 到 一 
j < iD ,这 时 需要 在 i 回 退 一 个 字符 ,从 start 到 (i 一 1) 是 当前 搜索 到 的 (“ 局 部 的 沪 最 长 字符 
串 。 随 后 的 问题 是 要 确定 下 次 再 搜索 时 的 起 点 ,显然 从 (start 十 1) 开 始 是 不 合适 的 ,因为 j 和 1 
已 经 重复 了 ,新 搜 到 的 字符 串 只 会 比 这 个 短 ; 从 (i 十 1) 开始 也 是 不 合适 的 ,因为 可 能 会 漏 掉 一 
段 字符 串 ,4 十 1) 到 i 之 间 是 没有 重复 的 。 

因此 ,最 适合 的 新 的 起 点 new_start 应 该 从 人 j 十 1) 开 始 , 而 这 时 i 无 需 再 从 new_start 开 


ex 
Sr xz 


CE 
fs 一 一 入 
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始 。 注 意 到 new_start 只 是 一 个 概念 性 的 ,是 再 次 搜索 的 (start) ,与 start 共享 一 个 变量 ,只 不 
过 修改 Start 的 值 而 已 。 
可 以 看 到 ,程序 中 的 注释 ,清楚 地 把 这 个 思路 展现 出 来 了 ,两 个 字符 相同 时 的 输出 标记 与 
起 点 的 调整 都 很 清楚 ,所 以 程序 的 可 读 性 非常 高 ,算法 也 最 简单 .最 优化 。 
在 循环 的 后 面 , 还 要 考虑 细节 ,就 是 当 搜 索 执 行 到 整个 字符 串 末 尾 时 的 处 理 。 仔 细 看 一 
看 ,这 后 面 两 句 话 还 可 以 合并 (merge) 到 循环 中 去 。 


int Searchmaxstr (Char x Srcycharx dst) 
《 
int leny,iyj,Sstart,Oostart,maxleni; 
char  *P = Srci 
if (!1src || !dst || !srcL0]) 


return 0 


Start = 0; 
oOstart = 0; 
maxlen = 0; 


1 = Start; 


do! 
二 ++ ; 
for(j = start; j<<i; j++) 
《 
让 (1p[i 刘 ||p[] == p[) 
《 
len = 工 一 start; 
if《〈maxlen << len) 
{ 
ostart = start; // 重新 标记 输出 字符 串 的 起 始 
maxlen = len; 
}》 
Start = j+1; 
break; 
}》 
} 
// 证 (1pBLi) break 
}while (p[i); 
strncpy (dst,&src[ostart ] ,maxlen) ; 
dst[maxlen] = 0; 


Teturn maxlen; 
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} 


大 体 上 数 了 一 下 ,这 个 函数 的 搜索 循环 体内 部 用 到 了 10 行 有 效 的 C 程序 行 ,而 前 面 的 回 
答 优 化 到 17 行 有 效 C 程序 行 时 ,就 党 得 再 没有 办 法 进一步 优化 了 。 其 实 程 序 的 优化 ,在 结构 
上 ,性 能 上 和 运行 效率 上 都 会 有 非常 高 的 改善 。 只 要 在 算法 上 有 效 地 改进 ,优化 的 空间 还 是 很 
大 的 。 在 诸如 TCP/IP 协议 或 操作 系统 原理 等 书 上 ,常常 可 以 看 到 一 些 专业 的 原型 代码 ,只 有 
少数 几 行 程序 却 能 实现 出 一 些 复杂 的 逻辑 功能 ,有 些 代码 片段 需要 一 个 普通 程序 员 几 百 行 、 甚 
至 几 千 行 才 能 实现 。 这 就 是 对 相关 算法 理解 深刻 的 体现 ,当然 高 超 的 编程 技术 ,精巧 的 实现 也 
是 必 不 可 少 的 。 

由 这 个 例子 可 以 看 出 ,事务 处 理 方面 的 算法 也 是 非常 重要 的 ,对 于 调用 频繁 的 系统 函数 库 
更 加 重要 。 

最 后 ,比较 后 面 的 两 个 实现 ,虽然 最 后 一 个 实现 在 语句 .最 终 的 汇编 代码 或 可 执行 的 机 器 
代码 上 都 较 前 一 个 小 ,但 是 从 运行 效率 和 指令 执行 的 流水 线 结构 上 来 看 , 它 不 一 定 是 两 个 程序 
中 最 优 的 。 在 前 一 个 例子 中 . 


while (p[i1= 0) 


处 理 机 在 执行 while( ) 判 断 时 ,处 理 器 的 指令 预 取 功能 会 取出 下 一 条 或 下 几 条 指令 ,这 个 
预 取 的 过 程 极 大 地 加 速 了 程序 的 执行 ,不 幸 的 是 对 于 条 件 为 “ 假 ” 的 导 卡 ,预先 读 取 的 循环 体内 
自 上 而 下 顺序 执行 的 指令 序列 流 不 会 被 执行 ,从 而 废弃 指令 预 取 队列 中 的 全 部 指令 , 转 到 
while 循环 体 之 后 的 指令 重新 取 指 。 这 种 情况 称 之 为 指令 预测 失败 。while( ){ } 只 有 最 后 一 
次 执行 时 才 会 预测 失败 ,而 在 后 一 种 情况 ,使 用 do { } while(cond), 这 时 处 理 机 会 顺序 取 
whileCcond) 之 后 的 指令 ,但 是 在 绝 大 多 数 的 情况 下 , while 还 会 跳 回 去 执行 循环 体 的 开始 语 
句 ,在 后 面 的 这 种 情况 下 ,指令 绝 大 多 数 预 取 失 败 , 只 有 最 后 一 次 条 件 不 成 立时 ,指令 预 取 才 会 
成 功 。 所 以 ,从 指令 流水 线 的 结构 来 看 ,使 用 while (cond ){ } 的 效率 优 于 do { } whileCcond) 。 

细心 的 读者 可 能 会 问 ,while(cond) { } 循 环 体 的 最 后 一 个 括号 要 执行 跳 转 ,这 不 也 会 引起 
流水 线 被 破坏 吗 ? 答案 是 否定 的 ,因为 对 无 条 件 转移 或 绝对 转移 的 情形 , 绝 大 多 数 流 水 线 结构 
的 CPU 都 会 处 理 这 种 预 取 ,这 时 会 预 取 无 条 件 转移 处 的 指令 ,而 条 件 转移 只 有 在 程序 运行 时 
才能 判断 当前 经 过 的 时 刻 条 件 是 否 为 真 。 

有 了 这 些 基础 ,就 可 以 进一步 对 第 二 种 情况 作 优化 ,使 用 形 如 : 


while (1) ( ，…… 让 (1 cond) break; } 


来 取代 do { }while (cond); 这 种 结构 。white(1) 并 不 需要 占用 处 理 器 的 时 间 , 它 在 编译 的 时 
候 甚 至 根本 就 不 产生 机 器 代码 ,而 while(1) 之 后 的 大 括号 的 后 一 个 大 括号 是 一 个 无 条 件 转 移 ， 
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它 条 件 地 跳 转 到 while(1) 之 后 的 语句 行 上 去 ,只 有 在 循环 体 之 后 的 让 (1 cond)break 才 执 行 一 
个 条 件 判断 ,因此 这 种 结构 中 , 绝 大 多 数 情况 下 指令 的 顺序 预测 仍然 是 成 功 的 。 


人 


1.5$.1 谦 愤 使 用 * 宏 ” 


下 面 的 例子 告 诚 我 们 使 用 宏 时 一 定 要 襄 慎 小 心 , 写 程序 不 能 凭空 脐 想 。 编 译 器 也 是 人 设 
计 的 ,所 以 编译 器 的 行为 是 依赖 于 人 的 设计 ,依赖 于 当时 设计 编译 器 的 人 的 思考 。 诚 然 , 了解 
编译 器 ,正确 理解 程序 的 结构 ,可 以 写 出 性 能 高 .稳定 性 好 的 程序 。 

看 看 这 个 例子 :. 

井 include <stdio.h> 

井 define ”cub(x) (X) < 〈X) < 《〈X)》 


main() 
{ 
int I= 10)， 
Printf("cub(%d) = 第 dNn" ,1i， cub(++i)); 
printf("newi = 区 dNn",i); 
} 
这 个 程序 会 打印 出 一 个 什么 样 的 结果 呢 ? 
看 起 来 ,题目 没有 任何 问题 。 设 计 者 的 意图 不 外 乎 是 想 把 一 个 变量 自 加 1, 然 后 计算 它 的 
立方 。 所 以 设计 者 期 望 得 到 如 下 的 结果 : 
cub(10》 = 1000 


new ll = 11 

不 幸 的 是 ,设计 者 把 i 十 十 写成 了 十 十 ib 那 么 结果 似乎 应 该 是 : 

cub(11) = 1331 (和 注 :1331=11x1ltx1t) 

new 1 = 11 

可 是 意 想不到 ,程序 的 结果 却 是 : 

cub(13) = 1872 

new li = 13 

这 个 结果 怎么 也 让 人 看 不 明白 吧 ? 

看 样子 ,在 打印 语句 中 , 的 值 没 有 执行 从 左 到 右 的 传递 顺序 。 

i 一 13 是 可 以 分 析出 来 的 ,因为 宏 展 开 中 ,cub( 十 十 D 被 编译 器 解释 为 : 
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《++i)x(++i)yxr(++I) 


那么 第 一 个 i 怎么 变 成 了 13 呢 ? 仔细 分 析 一 下 可 以 发 现 ,printf() 是 一 个 函数 ,在 调用 一 
个 函数 执行 跳 转 之 前 ,需要 把 所 有 的 参数 都 计算 出 来 。 也 就 是 说 ,如 果 函 数 的 参数 含有 表达 
式 ,那么 函数 中 的 表达 式 一 定 要 在 调用 函数 之 前 被 计算 好 ,更 进一步 ,如 果 一 个 参数 是 通过 调 
用 另 一 个 函数 所 得 到 的 返回 值 , 则 调用 这 个 函数 之 前 需要 执行 参数 所 代表 的 那个 函数 。 只 有 
所 有 的 参数 都 计算 出 来 ,万事 俱 备 之 后 , 才 会 执行 这 个 函数 调用 的 跳 转 。 不 同 的 调用 约定 传递 
参数 的 顺序 不 同 ,有 的 是 从 左 至 右 , 有 的 是 从 右 至 左 ,那么 从 这 个 例子 可 以 看 出 ,参数 的 计算 是 
从 右 至 左 的 ,这 就 解释 了 为 什么 printf() 的 第 二 个 参数 i 被 传人 了 13。 但 是 这 里 仍然 还 有 一 
个 疑 团 :显然 1872 既 不 是 11 的 三 次 方 ,也 不 是 13 的 三 次 方 ,那么 根据 宏 展开 ,cub( 十 十 iD) 一 
(11) x* (12 * (13)。 可 是 结果 却 出 人 意料 ,因为 11x 12 * 13 = 1716, 这 又 怎么 解释 呢 ? 1872 
是 从 哪里 来 的 ? 

要 解 开 这 个 疑 团 ,不妨 试 着 做 一 个 因 式 分 解 ,( 因 式 分 解 这 一 步 你 是 否 能 想得到 ?)，1872 
首先 试 着 用 13 去 除 一 下 ,1872/13 = 144 ,那么 1872 一 定 是 等 于 : 


1872 = 12 # 12 交 3 


如 果 你 想 要 就 此 放弃 的 话 ,我 也 无 话 可 说 ,也 许 你 觉得 纠缠 在 这 种 毫 无 意义 的 小 事 上 没有 
任何 意义 。 如 果 你 愿意 继续 跟着 我 寻根 问 底 的 话 ,那么 一 定 会 有 耐心 把 下 面 的 讨论 看 完 。 事 
实 上 ,系统 设计 要 求 程序 员 只 有 养 成 这 种 寻根 问 底 的 良好 习惯 ,才能 在 过 到 问题 时 找到 问题 的 
根源 (root cause) ,这 对 于 系统 设计 的 稳定 性 是 非常 重要 的 。 

根据 C 十 十 的 计算 顺序 约定 来 仔细 研究 一 下 

“十 十 var” 应 该 是 先 执行 自 加 ,然后 再 运算 ,而 “var 十 十 ” 则 应 该 是 先 执行 运算 ,然后 再 
自 加 。 

第 一 步 , 当 编译 器 编译 到 (十 十 D) 的 时 候 ,i=11, 此 时 还 没有 运算 。 

第 二 步 , 当 编 译 器 编译 到 (十 十 ) * 的 时 候 , 由 于 第 二 个 操作 数 还 没 确定 ,所 以 需要 先 计 
算 第 二 个 操作 数 , 即 先 编译 第 二 个 (十 十 D ,此 时 得 到 i 一 12。 

第 三 步 , 当 编译 器 编译 2 个 (十 +D x* (十 十 D) 中 间 的 “x ”时 , 按 同 等 优先 级 从 左 到 右 的 原 
则 ,下 一 步 必须 执行 * ( 乘 ) 运 算 了 。 注 意 到 乘 的 2 个 操作 数 都 是 i,( 十 十 D 只 不 过 是 附加 于 i 
之 上 的 操作 。 因 此 操作 数 应 该 从 i 取 值 。 有 些 人 (编译 器 ) 说 ,把 前 面 的 i 预先 保存 在 处 理 机 内 
部 (例如 一 个 寄存 器 ) ,等 待 后 面 的 运算 ,这 有 两 方面 是 不 合理 的 ， 

@ 程序 中 含有 了 2 个 或 是 更 多 的 i 的 备份 。 这 对 于 一 个 程序 变量 (或 一 个 硬件 退 辑 ) 来 说 
显然 是 不 应 该 的 。 

@) 编译 器 怎么 知道 后 面 需要 执行 乘 而 超 智能 地 把 i 的 值 保 存 起 来 呢 ? 

这 里 i 只 是 一 个 变量 , 它 是 一 个 物理 的 载体 。 硬 件 设计 的 流水 线 结构 中 ,也 经 常 有 指令 流 
水 线 产 生 副作用 的 理 象 ,例如 , 某 些 处 理 机 刚 Load 的 数据 还 不 能 立即 参与 下 一 步 的 运算 , 尽 
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管 如 此 ,为 了 保持 系统 的 逻辑 一 致 性 ,无 论 是 Cache, 还 是 Register, 或 是 Memory, 它 们 都 不 是 
智能 地 ( 腑 想 地) 增加 额外 的 记忆 。 

从 软件 的 角度 来 解释 ,作为 一 个 变量 , 它 有 两 个 域 , 一 个 是 地 址 域 ,一 个 是 值 域 。 一 个 备份 
意味 着 一 个 变量 只 有 唯一 的 一 个 地 址 域 , 而 它 的 值 却 是 可 变 的 (变量 ) ,无 论 是 十 十 ,还 是 乘 ,都 
是 在 这 个 变量 上 施加 的 运算 ,或 是 把 这 个 变量 作为 一 个 操作 数 。 

对 于 一 个 执行 机 而 言 , 让 它 执行 十 十 i, 它 就 会 毫 无 选择 地 执行 十 十 ,让 它 执行 乘 的 时 候 ， 
它 就 会 执行 乘 运算 。 对 于 一 个 乘 运算 , 它 绝 不 会 把 一 个 表达 式 ( 十 十 D 当 作 直 接 操作 数 , 在 这 
里 乘 运算 的 两 个 操作 数 实际 上 都 是 i, 但 由 于 十 十 的 优先 级 优 于 乘 ,( 也 即 是 第 二 个 十 十 优先 级 
优 于 第 一 个 乘 ) , 因 些 得 到 12 * 12, 中 间 结 果 当 然 不 应 该 存 于 i 余 下 的 分 析 就 很 明显 了 。 问 题 
的 关键 是 要 正确 理解 1 是 一 个 变量 ,而 不 是 一 系统 特定 的 变化 的 值 , 它 是 一 个 变量 ,是 一 
子 , 是 一 个 容器 ,确切 地 说 , 它 是 内 存 中 一 个 4 字 节 长 的 存储 单元 (在 32 位 机 中 )。 每 次 要 执行 
操作 时 , 它 应 该 是 从 这 个 变量 的 当前 值 进行 操作 ,而 不 是 从 这 个 变量 的 某 个 历史 的 值 来 作 
运算 。 

分 析 到 这 一 步 , 如 果 善 于 总 结 的 话 , 所 下 的 功夫 就 没有 白费 了 。 比 如 说 ,从 这 个 例子 就 可 
以 加 深 读 者 对 变量 的 值 域 和 变量 的 地 址 域 这 两 方面 属性 的 理解 。 如 果 还 没有 意识 到 这 一 点 ， 
或 者 是 每 次 都 半途 而 废 ,不 去 寻根 求 源 ,那么 只 会 在 原 地 踏步 。 

之 所 以 要 在 这 些小 问题 上 “纠缠 ”, 是 因为 我 希望 本 书 的 每 位 读者 ,都 应 该 在 设计 中 做 到 心 
中 明了 ,知道 自己 在 做 什么 ,知道 程序 的 运行 情况 是 如 何 推进 的 。 作 为 一 个 系统 程序 员 , 要 养 
成 随时 多 问 几 个 “WHY? 的 习惯 ,而 不 只 是 程序 可 以 工作 就 轴 了 。 

小 结 : 

这 个 小 程序 有 以 下 几 个 地 方 可 以 引 以 为 戒 ， 

@ 宏 名 最 好 要 大 写 ,例如 写成 CUB(x) ,这 样 就 不 会 在 调用 时 误 把 cub ) 当 郴 数 ， 

同时 注意 写成 


井 define coaco 《X) 关 〔《 区 ) 关 《X) 


即 添加 括号 ,以 免 在 调用 时 ,传人 的 一 个 表达 式 因 结合 顺序 的 问题 导致 不 易 发 现 的 错误 。 

G@ 第 二 是 把 涉及 变量 运算 的 宏 改 为 static 函数 ,例如 static int CUB(int x) { return 
XXXX3)。 

加 最 后 ,如 本 例 所 示 , 宏 调 用 时 ， 最 好 不 要 传人 表达 式 , 特 别 是 自 增 或 是 自 减 之 类 的 表达 
式 , 尽 量 不 使 用 模糊 语义 或 会 引起 歧义 的 程序 句 。. 

总 之 ,在 调用 宏 的 时 候 一 定 要 小 心 谨慎 ,仔细 推 殴 。 讨 论 到 这 里 ,或 许 我 们 总 算 可 以 松 一 
口气 ,问题 是 否 该 结束 ? 回答 应 该 是 的 。 然 而 我 在 VC 下 做 了 一 个 实验 却 发 现 同样 一 个 程序 
却 得 出 不 同 的 结果 。 


//t.cpp : 为 一 个 控制 台 应 用 程序 定义 程序 人 口 点 ” 
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// 
井 include "stdafx.h" 
井 define ”cub(x) (CX) < 〈X) 闪 《 开 ) 
main() 
{ 
int I=10; 
printf("cub(%d) = 多 dNn",i， cub(C++I))3 
printf("new 研 = 多 dvn" iD; 
}》 


在 Debug 版 本 下 打印 出 : 


cub(13) = 1872 


new = 13 


而 在 Release 版 本 下 却 打印 出 : 


cub(13) = 2197 


new ii = 13 


由 此 看 出 ,这 样 一 个 简单 的 程序 ,在 不 同 编译 优化 时 却 得 到 截然 不 同 的 结果 。 如 果 要 深信 人 


分 析 这 两 种 结果 ,在 反 汇 编 的 情况 下 ,就 不 难 发 现 二 者 之 间 的 差异 。 显 而 易 见 ,这 是 编译 器 解 
释 方式 不 同 所 致 。 


以 后 读者 在 调试 Kernel 或 调试 Driver 时 经 常会 发 现 这 样 的 问题 ,出 了 这 种 问题 ,也 许 会 


很 郁闷 ,一筹莫展 。 在 一 个 大 的 系统 之 中 ,要 搜寻 一 个 微小 的 朴 忽 , 真 的 是 犹如 大 海里 捞 针 。 
那么 ,要 期 望 成 为 一 位 合格 的 系统 软件 工程 师 , 就 只 有 从 身边 的 点 点 滴 滴 做 起 。 时 时 刻 刻 , 细 
心 留意 ,精心 构思 自己 写 的 每 一 小 段 程 序 , 使 它 的 应 用 不 会 发 生 歧 义 。 


沿 


遇 到 一 些 看 似 很 小 的 问题 , 切 莫 轻 言 放弃 ! 
精明 的 程序 员 不 在 乎 于 一 些小 的 技巧 ,而 在 于 如 何 实 实在 在 地 把 一 个 问题 准确 表达 和 实 


。 同 一 个 编译 器 在 不 同 优化 级 别 时 还 会 产生 不 同 的 语义 解释 ,所 以 设计 中 力求 避免 歧义 。 


如 果 把 程序 中 的 十 十 i 换 成 i 十 十 ,如 下 所 示 。 


井 define ”cub(x) (X) #〔(X) 关 〈X) 
main() 
《 

int 夺 = 10; 


printf("cub(%d) = 区 dNn" ,icub(Ci++ ))3 
printf("newi = $%dNn"，i); 
} 


则 在 Vstudio C 十 十 中 ,在 Debug 版 本 下 打印 出 : 
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cub(10》 = 1000 


new II = 13 


而 在 Release 版 本 下 却 打印 出 : 


cub(13》 = 1000 


newi = 13 


在 GCC 中 ,Debug 版 本 和 Release 版 本 下 ,都 得 到 如 下 相同 的 结果 : 


cub(13) = 1000 


new 1 = 13 


比较 起 来 ,GCC 编译 器 更 准确 一 些 ,而 微软 对 于 cub( 十 十 D 所 编译 出 来 的 Release 版 本 下 
的 13 * 13x 13 一 2197 的 结果 是 错误 的 。 为 此 ,我 们 不 应 该 迷信 大 公司 ,也 不 应 该 迷信 微软 , 微 
软 的 操作 系统 和 编译 器 仍然 存在 大 量 的 错误 与 漏洞 。 当 然 ,我 不 是 为 了 指责 某 个 公司 或 某 个 
人 ,只 是 希望 大 家 在 学 习 这 本 书 之 后 ,能 够 消除 头脑 中 的 迷信 观念 ,不 会 过 分 依赖 于 他 人 。 只 
有 跳出 观念 上 的 束缚 ,我 们 才能 有 所 创新 。 特 别 是 对 于 正 准备 投身 于 系统 软件 开发 的 程序 员 
来 说 ,如 果 想 走 得 比 同 行 更 远 一 点 ,眼界 更 高 一 些 ,那么 一 定 得 消除 心目 中 对 操作 系统 、 对 编译 
器 的 过 分 依赖 ,消除 心目 中 认为 它们 很 神秘 的 观点 。 

再 次 归纳 一 下 :通过 这 节 的 讨论 ,我 们 明白 了 : 

图 使 用 宏 时 要 特别 小 心 , 特 别 是 在 传人 表达 式 的 时 候 , 最 好 不 要 传人 自 增 \ 自 减 的 变量 ， 

而 应 明确 使 用 十 1, 一 1 等 ,需要 修改 变量 时 ,应 该 使 用 分 离 的 步骤 。 

国 变量 具有 地 址 域 和 值 域 两 方面 的 属性 。 

量 编译 器 的 不 同 优化 级 别 可 能 产生 完全 不 相同 的 两 种 结果 。 

国 不 同 的 编译 器 可 能 产生 出 不 同 的 代码 。 

国 编程 过 程 中 应 当 和 避免 使 用 有 歧义 的 程序 语句 。 


1.5.2 正确 理解 预定 义 宏 


在 讨论 编译 宏 之 前 想 解释 一 下 什么 是 编译 预定 义 宏 ? 它 有 何 作 用 ? 为 此 , 先 来 看 下 面 一 
个 实例 。 

// 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 

// 请 问 下 面 的 代码 输出 什么 ? 

# include <<stdio.h> 

void myfunc(〈) 

malin(〈) 

传 、 

井 ifndef _R_ 

井 define 
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井 endif 
myfunc〔) ; 
myfunc《〔〈); 

#undet _&R_ 

} 

void myfunc (〈》 

{ 

提 ifdef AR_ 
printf (”R_ is defined! Nn"); 

井 undef 

井 endif 

》 


/7/ 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


这 里 实际 上 是 考查 对 编译 宏 的 理解 。 

编译 宏 只 在 编译 预 处 理 时 使 用 ,而 不 会 出 现在 真实 程序 代码 的 控制 中 ,也 不 是 真正 的 指 
令 。 通 过 定义 一 些 编译 宏 可 以 指示 编译 器 哪些 代码 是 本 次 编译 所 需要 的 。# ifdef 与 #endif 
告诉 编译 器 如 果 某 个 编译 变量 (开关 ) 定 义 过 ,( 注 ,赋值 也 是 定义 ,例如 #define -A_ 2), 则 
编译 器 将 处 理 下 面 的 程序 语句 ,直至 遇 到 # endif(# ifdef 与 # endif 必须 成 对 出 现 )。 辣 时 , 间 # 
ifdef 与 # endif 并 不 关心 它 所 包含 的 语句 是 什么 ,也 就 是 说 , 它 可 以 跨越 多 个 画 数 , 即 多 个 函 
数 各 自 的 一 部 分 ,或 者 一 条 语句 的 一 部 分 。 总 之 ,# iftdef 并 不 关心 程序 的 实际 语义 ,而 只 是 告 
诉 编译 器 ,依据 # 计 (0…) 的 条 件 来 决定 在 #ifdef 与 #endif 之 间 的 那 部 分 程序 是 否 被 包含 到 实 
际 程序 中 ,成 为 程序 的 一 部 分 。 

下 面 来 看 第 一 遍 编 译 预 处 理 时 得 到 了 什么 样 的 等 效 代码 。 


// + 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


// 请 问 下 面 的 代码 输出 什么 == 之 预 编译 器 输出 // 请 问 下 面 的 代码 输出 什么 
# include <<stdio.h> == > 预 编译 器 输出 # include <stdio.h>> 
void myfunc(); == > 预 编 译 器 输出 void myfunc ()*# 

main () == > 预 编译 器 输出 main () 

{ == 之 预 编译 器 输出 ! 

井 ifndef _R_ == 之 预 编 译 器 输出 〈 无 ) 

提 define __ == > 预 编 译 器 输出 〈 无 ) 

提 endif == 之 预 编译 器 输出 〈 无 ) 


说 明 :上 面倒 数 三 条 语句 中 由 于 _A_ 未 定义 ,所 以 无 输出 。 但 是 倒数 第 二 句 让 也 编 译 器 记 
录 下 一 个 新 的 编译 变量 , 即 _A_ 被 定义 。 


myfunc〔〈); == 盖 输出 myfunc(); 
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插 myfunc《〈)5 == 过 输出 myfunc()3 
入 井 undef _R_ == 盖 输出 〈 无 ) 
软 说 明 : 最 后 一 条 语句 , 预 编 译 器 将 _A_ 置 为 未 定义 状态 
件 } == > 输出 } 
设 void myfunc (〈) == 盖 输 出 void myfunc() 
{《 == 之 输出 ! 
针 提 ifdef _aR_ == > 预 编译 器 检查 _A_，R_ 处 于 未 定义 状态 
起 printf ("_R_ is defined! \n"); == > 此 句 不 会 被 预 编译 器 处 理 
与 井 undef _R_ == 之 此 句 不 会 被 预 编译 器 处 理 
力 #end 计 == 之 输出 〈 无 ) 
法 } == 之 预 编 译 器 输出 } 
// + 二 二 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 
36 于 是 得 到 下 面 第 一 遍 扫 描 后 的 代码 输出 。 
// 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 士 十 十 十 十 十 
// 请 问 输出 什么 ? 


井 include <stdio.h> 
void myfunc (7); 
main《() 
《 
myfunc (); 
myfunc【〔〈); 
} 
void myfunc《〈) 
{ 
} 


// 十 + 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 
第 二 遍 编 译 时 ,编译 器 才 会 分 析 语法 (包括 注释 ) 。 由 于 预 编译 宏 是 在 预 编译 时 ,而 不 是 在 
运行 时 处 理 的 ,所 以 ,对 于 下 述 语句 
井 ifndef _R-_ 
井 define _A_ 
间 endif 
myfunc ()， 
myftunc〈); 
井 undef _R_ 
当 编 译 到 myfunc(? 时 ,只 是 插 和 人 调用 函数 ,而 不 是 转 去 解释 一 个 函数 的 内 部 语句 。 即 是 
说 ,编译 器 是 顺序 扫描 的 ,编译 不 等 同 于 执行 。 
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1.5.3 避免 歧义 


每 个 程序 员 写 程序 时 都 会 有 自己 的 风格 ,各 个 系统 也 采用 不 同 的 编程 风格 ,没有 一 个 通用 
的 标准 。 但 是 为 了 探讨 程序 实现 的 性 能 与 效率 ,下 面 就 提出 一 些 问 题 来 进行 讨论 。 

对 于 一 个 庞大 系统 软件 的 设计 ,我 并 不 灶 同 为 了 追求 一 些 吹 毛 求 症 的 小 技巧 而 把 程序 设 
计 得 很 复杂 或 很 玄妙 。 在 系统 设计 中 ,重要 的 是 要 做 到 结构 清楚 性 能 稳定 .考虑 周密 ,精心 设 
计 所 有 可 能 的 情况 ,遍历 所 有 的 执行 路 径 才 至 关 重要 。 

现代 的 编译 器 已 经 足够 智能 ,能 自动 作 高 性 能 的 程序 优化 。 所 以 ,作为 一 个 程序 员 ,首先 
要 专注 于 解决 自己 的 问题 ,在 准确 的 基础 之 上 再 考虑 优化 。 

与 之 相反 ,由 于 不 同 的 平台 不同 的 编译 器 所 解释 的 方法 和 支持 的 特性 往往 也 各 不 相同 ， 
这 给 移植 带 来 困难 。 我 认为 在 程序 中 使 用 简单 明了 的 语句 表达 , 才 是 最 好 的 编译 风格 。 如 果 
能 做 到 以 简单 化 复杂 ,所 编写 的 程序 稳定 性 就 会 提高 ,通常 情况 下 效率 也 会 提高 。 当 然 , 最 直 
接 的 方法 用 汇编 来 构造 ,但 对 于 一 个 大 型 的 系统 ,完全 用 汇编 显然 是 不 可 能 的 。 所 以 也 不 能 走 
极端 ,应 该 根据 实际 情况 编写 简洁 的 程序 ,这 可 以 避免 歧义 ,也 便于 程序 的 维护 。 

为 了 避免 歧义 ,一 个 比较 好 的 方法 是 多 使 用 括号 。 例 如 : 


执行 这 条 语句 之 后 ,a,b'c 的 值 各 是 什么 呢 ? 要 获得 答案 , 需 仔 细 查 阅 参考 书 , 而 且 还 要 
依赖 于 C 编译 器 的 开发 者 也 严格 按照 参考 书 上 的 规范 来 实现 。 由 此 引出 很 多 的 麻烦 和 代价 ， 
为 什么 非 要 使 用 这 条 上 汲 难 懂 的 语句 呢 ? 不 如 写成 : 


aa= (b++) + ci; 
或 
a=b+(+t+c); 


意思 不 就 很 清楚 了 吗 ? 为 什么 非得 一 定 要 搞 得 很 含混 ? 即使 对 于 十 十 与 十 的 结合 顺序 搞 
得 非常 清楚 明了 ,也 不 要 使 用 这 样 的 技巧 ,除非 写 程序 的 目的 就 是 让 人 看 不 懂 。 

我 认为 ,程序 设计 中 ,简单 是 最 好 、 最 直接 的 方式 ,也 是 效率 最 高 .最 不 容易 出 错 的 方式 。 
就 好 比 人 的 手 和 脑 一 样 ,是 人 最 直接 .最 宝贵 的 工具 。 我 画图 就 常 使 用 画图 板 , 有 一 次 一 位 同 
事 作 一 些 界面 图 标 , 花 了 很 长 时 间 还 是 对 不 齐 ,结果 我 教 他 使 用 画图 板 放 大 的 模式 来 数 点 数 ， 
一 下 子 就 数 明 了 ,程序 设计 的 道理 也 是 类 似 的 。 

上 面 只 是 一 个 例子 ,说 明 程 序 一 定 要 写 得 易 懂 、 易 读 。 这 样 就 可 以 减少 错误 ,减少 误解 。 
多 用 括 叶 是 减少 歧义 的 一 个 很 好 的 手段 , 它 比 记 住 各 种 程序 设计 中 的 结合 顺序 以 及 正确 地 熟 
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练 使 用 要 简单 容易 。 又 比如 : 

if (a&0xfft || b+c>6) 

在 这 里 ,要 注意 的 是 空格 并 不 改变 结合 顺序 ,所 以 写成 b 十 c>6 与 b+c 之 6 或 b 十 c>6 
都 没什么 不 同 。 上 面 这 个 条 件 表达 式 也 许 满足 了 设计 者 的 意愿 ,但 看 起 来 很 不 严谨 。 可 能 会 
有 不 同 的 理解 ,或 者 需要 查 语法 才能 确定 。b 十 c>>6 到 底 是 (b 十 c) 之 6 昵 ? 还 是 b 十 (c>>6) 
呢 ? 正确 的 做 法 是 写成 如 下 的 形式 : 


if ((a&0xff) || ((b+c)>6)) 


这 样 写 就 很 规范 .清楚 明了 。 


as 第 人 
多 任务 操作 系统 


在 散人 式 软件 的 设计 中 ,由 于 是 设计 整个 能 人 式 软件 产品 ,其 中 很 大 一 部 分 工作 是 针对 特 
定 的 硬件 平台 开发 某 个 嵌入 式 操作 系统 软件 平台 ,从 而 需要 参与 到 操作 系统 其 中 一 部 分 的 设 
计 。 由 于 软件 分 层 , 作 为 芯片 设计 公司 ,或 OEM 提供 商 , 主 要 参与 到 与 硬件 相关 的 驱动 程序 
的 设计 ,这 部 分 软件 被 称 之 为 OAL 层 。 尽 管 OAL 层 主 要 与 硬件 打交道 ,但 是 ,扎实 的 操作 系 
统 知识 对 于 嵌入 式 软件 程序 员 来 说 ,是 必 备 的 基本 功 。 深 入 理解 操作 系统 ,才能 掌握 OAL 设 
计 的 各 种 系统 接口 ,从 而 实现 OAL 层 所 要 达到 的 功能 ;才能 与 操作 系统 的 各 个 组 件 有 机 地 结 
合 起 来 ,实现 整个 系统 的 功能 ;同时 ,也 才能 有 的 放 矢 , 优 化 整个 系统 的 性 能 。 

全 面 讨论 操作 系统 原理 不 是 本 书 的 范畴 。 本 书 没有 展开 与 苦 人 式 软 件 设计 不 很 相关 的 内 
核 机 制 , 例 如 进度 调度 ,内 存 页 面 管理 等 ,这 些 内 容 是 操作 系统 核心 开发 者 所 要 深入 钻研 的 。 
尽管 如 此 ,通用 的 操作 系统 原理 是 基础 。 操 作 系 统 原 理 方面 ,有 很 多 国内 外 专著 ,讨论 都 很 全 
面 、. 系 统 和 深入 。 如 Andrew S， Tanenbaum 写 的 Modadern Ozperatirag Systemag 。 

在 掌握 了 操作 系统 基本 原理 的 基础 之 上 ,可 以 把 一 些 程序 设计 技巧 应 用 于 操作 系统 设计 
的 实践 中 。 骨 人 式 操 作 系 统 与 通用 的 操作 系统 相 比 较 , 它 们 既 有 共性 也 有 个 性 。 骨 人 式 系 统 
软件 程序 员 不 需要 从 头 开始 设计 一 个 完整 的 操作 系统 ,只 需要 关心 OAL 接口 部 分 最 核心 的 
原理 和 方法 。 

本 章 将 讨论 那些 与 散人 式 操作 系统 实践 ,特别 是 对 于 人 通 入 式 操作 系统 OEM 开发 者 直接 
相关 的 一 些 话题 ,其 中 包括 多 任务 环境 、 模 块 间 同 步 与 通信 协同 .驱动 设计 以 及 通用 库 ( 动 态 
库 , 静 态 库 等 ) 设 计 中 可 重 人 性 等 问题 。 为 了 避免 重复 ,与 驱动 设计 密切 相关 的 IO 系统 则 放 
在 驱动 模型 一 章 中 详细 讨论 。 

OAL (OEM Adaptive Layer) 指 开发 与 特定 硬件 平台 紧密 相关 的 那 部 分 软件 抽象 层 。 当 
然 , 嵌 人 式 软件 的 设计 范畴 并 不 单纯 指 硬件 适 配 层 ,其 人 式 软 件 的 开发 还 会 涉及 到 操作 系统 的 
很 多 方面 ,通常 把 OEM 嵌 和 人 式 软件 开发 者 所 要 开发 的 软件 范畴 称 之 为 板 级 支持 包 BSP 
(Board Support Package) , 它 是 一 个 戏 人 式 操作 系统 的 一 部 分 ,专业 的 RTOS 提供 商 提供 和 
维护 操作 系统 的 核心 部 分 ,如 Linux, WinCE 的 系统 核心 的 代码 。 “ 

另外 ,本 章 在 讨论 多 任务 的 时 候 , 也 是 以 程序 实现 的 角度 来 讨论 系统 需求 , 而 不 是 单 从 理 
论 上 进行 讲解 。 
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2 板 级 支持 包 


简单 地 说 , 板 级 支持 包 是 操作 系统 软件 分 层 的 产物 。 操 作 系统 核心 由 专业 的 开发 队伍 维 
护 着 公用 的 执行 体 核 心 ,它们 是 所 有 硬件 平台 共用 的 操作 系统 核心 。 不 同 的 硬件 厂商 开发 特 
定 于 自己 硬件 的 软件 实现 。 对 于 OEM 提供 商 ,他 们 只 需要 提供 少量 的 ,与 底层 硬件 相关 的 软 
件 实现 ,就 可 以 在 自己 的 硬件 平台 上 运行 一 个 通用 的 操作 系统 平台 。 因 此 , 板 级 支持 包 是 为 了 
支持 特定 的 硬件 平台 ， 在 特定 的 硬件 平台 上 运行 一 个 通用 的 操作 系统 平台 所 要 提供 的 那 部 分 
软件 。 

哈 和 式 软件 的 结构 框图 如 图 1 - 1 所 示 , 两 条 虚线 之 间 的 软件 组 件 表示 嵌 人 式 操作 系统 基 
本 平台 ,虚线 之 上 的 部 分 表示 应 用 程序 ,最 下 边 虚线 之 下 的 部 分 表示 特定 的 硬件 开发 平台 。 可 
以 看 到 ,无 论 是 应 用 程序 还 是 操作 系统 ,都 采用 分 层 模型 的 结构 来 设计 ,其 主要 目的 是 增加 软 
件 的 复 用 与 系统 的 维护 性 。 嵌 入 式 系统 软件 工程 师 所 设计 的 软件 是 位 于 操作 系统 核心 与 硬件 
平台 之 间 的 那 部 分 OAL 软件 层 ,这 也 是 本 书 的 读者 所 关心 的 设计 内 容 。 

操作 系统 是 一 个 庞大 的 软件 体系 ,研究 者 的 着 眼 点 不 同 , 对 于 它 的 组 成 结构 就 会 有 不 同 的 
划分 ,大 致 可 分 为 进程 调度 .存储 管理 .文件 系统 .I/O 设备 管理 和 进程 通信 。 有 的 书 上 把 作业 
管理 提出 来 作为 一 项 组 成 部 分 ,有 些 书 把 进程 通信 归 到 进程 管理 。 其 实 如 何 划 分 ,是 着 眼 点 不 
同 的 问题 ,这 里 不 重点 讨论 这 些 成 分 划分 的 问题 。 

由 于 操作 系统 的 分 层 设 计 模 型 ,操作 系统 核心 处 理 了 进程 调度 .存储 管理 .文件 系统 .IO 
设备 管理 以 及 用 户 程序 管理 的 绝 大 部 分 问题 。 所 以 如 果 不 打算 成 为 一 个 操作 系统 核心 的 设计 
成 员 ,那么 就 可 以 不 必 关 心 操 作 系统 原理 ,不 必 关 心 内 核 是 如 何 调度 一 个 等 待 线 程 ,不 必 去 关 
心 磁盘 文件 系统 inode 的 建立 ,应 用 程序 的 加 载 ,外 部 符号 的 解析 ;存储 空间 的 分 配 与 释放 等 
事情 。 

然而 事实 并 非 完全 如 此 ,OAL 层 与 操作 系统 核心 不 是 单纯 的 一 种 简单 的 调用 与 被 调用 的 
线性 层次 关系 ,二 者 相互 参 和 ,而 且 OAL 层 需要 实现 某 些 核心 的 系统 功能 。 必 要 的 时 候 ， 
OAL 设计 人 员 可 能 需要 更 改 操作 系统 核心 那些 对 于 所 有 系统 公共 的 Public 或 Common 目录 
下 的 内 容 。 所 以 ,对 于 像 WinCE 这 样 由 微软 牢 牢 控制 着 操作 系统 核心 的 设计 平台 ,仍然 开源 
了 很 多 Common 的 代码 ,由 此 OAL 设计 人 员 可 以 根据 自己 系统 的 需求 对 公共 代码 部 分 进行 
修改 与 定制 。 对 于 像 Linux 这 样 的 开源 操作 系统 ,程序 员 更 可 以 深入 到 所 有 核心 模块 。 


2. 2 ” 谱 入 式 操作 系统 与 实时 性 


人 


嵌入 式 操作 系统 有 时 又 称 为 实时 操作 系统 (real time operation system) ,二 者 是 既 有 区 别 
又 有 联系 的 两 个 概念 ,下 面 加 以 简单 讨论 。 
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2.2.1 庶 入 式 操作 系统 


财 和 人 式 操作 系统 (embedded operating system) 是 在 通用 操作 系统 基础 上 发 展 起 来 的 , 通 
过 定制 化 和 设计 专用 化 ,可 应 用 于 工业 控制 个 人 移动 媒体 或 其 他 专用 设备 之 中 的 控制 程序 。 
因此 ,可 以 把 和 能 和 人 式 操作 系统 理解 为 单片机 控制 程序 与 运行 于 工作 站 或 桌面 系统 之 上 的 通用 
操作 系统 之 间 的 一 个 软件 产物 。 

作为 早期 的 8 位 或 16 位 单片机 系统 而 言 , 由 于 控制 任务 相对 简单 ,各 个 外 部 事件 或 系统 
内 部 的 控制 都 由 一 个 中 央 控 制程 序 来 控制 ,就 好 比 一 个 单一 线程 的 应 用 系统 ,整个 系统 只 有 一 
个 main 函数 人口 ,没有 太 多 的 分 支 。 

但 对 于 像 PC 机 那样 的 桌面 系统 或 复杂 的 工作 站 而 言 , 就 需要 处 理 许多 通用 的 事务 ,例如 
科学 计算 ,文字 处 理 .电子 商务 .互联 网 .游戏 、 多 媒体 播放 ,等 等 。 技 术 发 展 到 今天 , 像 桌面 系 
统一 类 的 通用 系统 从 硬件 和 软件 方面 都 发 展 得 相当 迅猛 ,硬件 资源 丰富 ,处 理 机 的 速度 非常 
快 , 操 作 系统 及 应 用 程序 的 功能 既 丰 富 又 稳定 。 

32 位 RISC CPU 的 出 现 , 可 以 认为 是 一 个 介 于 单片机 与 CISC CPU 之 间 的 产品 ,从 此 也 
给 内 人 式 系 统 的 发 展 带 来 了 深刻 革命 。 

从 硬件 上 说 ,RISC 多 级 的 流水 线 结构 ,规整 的 指令 长 度 ,精简 的 指令 ,扩大 的 通用 寄存 器 
文件 等 ,都 是 优 于 CISC CPU 的 方面 ,而且 RISC 逻辑 相对 简单 , 译 码 和 执行 相对 更 快 ,占用 硅 
片 的 面积 小 ,成 本 相对 较 低 ,也 利于 集成 到 片上 系统 (SoC) 。 

从 软件 上 说 ,嵌入 式 设 备 需 要 处 理 更 多 的 事务 ,这 些 事务 往往 同时 发 生 ， 例如 当 用 户 正在 
使 用 Smart-Phone 编辑 一 个 文本 时 ,又 不 想 错 过 一 个 紧急 呼叫 ;或 用 户 正在 欣赏 音乐 时 ,还 和 希 
望 同 时 阅读 新 闻 或 电子 邮件 ;或 一 个 工业 控制 设备 在 把 拍摄 下 来 的 图 像 向 远程 发 送 的 同时 ,还 
希望 对 外 部 温度 ,水 位 和 和 气味 等 的 变化 做 出 应 急 反应 等 ,这 些 都 需要 多 任务 。 

骨 人 式 设备 多 任务 的 需求 推动 了 单片机 控制 程序 的 变革 ,而 操作 系统 多 任务 的 特性 正好 
适应 于 这 一 需求 。 

相对 于 采用 CISC 的 桌面 系统 而 言 , 对 于 CPU 使 用 精简 指令 、 外 部 设备 的 资源 受到 限制 
的 系统 ,其 操作 系统 也 必须 发 生变 化 。 首 先 , 由 于 通 人 式 操 作 系统 里 往往 没有 像 PC 机 那样 存 
储 容量 非常 庞大 的 硬盘 ,系统 软件 和 应 用 程序 一 般 都 存储 在 一 些 几 十 兆 的 闪存 (flash) 中 ,所 
以 需要 从 通用 操作 系统 中 去 除 掉 一 些 不 使 用 的 应 用 程序 和 应 用 程序 函数 库 , 以 及 操作 系统 中 
不 使 用 的 各 种 服务 .各 种 协议 栈 和 其 他 软件 组 件 等 。 除 此 之 外 ,它们 的 指令 集 不 同 ,而 且 RISC 
往往 只 支持 CISC CPU 指令 集 的 一 个 子 集 , 例 如 很 多 RISC CPU 系统 不 支持 乘除 法 ,也 不 支 
持 浮 点 数 的 处 理 ,指令 集 的 指令 二 进 制 编码 也 全 然 不 同 , 所 以 即使 将 桌面 系统 上 现 有 的 操作 系 
统 搬 到 基于 RISC 的 内 人 式 设 备 上 也 无 法 运行 。 

由 以 上 讨论 可 知 ,简单 地 说 ,其 和 人 式 设备 由 于 资源 受 限 .外 部 设备 专用 化 .CPU 的 特殊 化 ， 
都 要 求 基于 RISC 的 能 人 式 设备 所 使 用 的 操作 系统 软件 有 别 于 传统 的 通用 操作 系统 。 它 需要 
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从 软件 组 成 上 精简 ,从 设计 上 修改 ,还 需要 从 编译 上 重新 构建 。 


2.2.2 实时 操作 系统 


艇 人 式 操 作 系统 又 叫 实 时 操作 系统 ,是 因为 散人 式 操作 系统 的 实时 性 要 求 ,是 嵌入 式 操作 
系统 的 一 个 显著 特性 。 

所 谓 实时 性 ,就 是 对 响应 紧要 事务 的 请 求 能 够 作出 快速 .准确 .及 时 的 响应 。 比 如 ,对 于 危 
险 环境 外 部 数据 的 采取 ,对 于 紧急 情况 的 响应 等 。 在 多 媒体 播放 过 程 中 ,要 求 对 音 视 频 作 出 及 
时 、 快 速 的 处 理 , 否 则 声音 或 画面 会 出 现 断 续 。 在 人 机 接口 中 ,快速 对 用 户 按键 的 响应 也 是 实 
时 性 的 范畴 。 

如 果 在 一 个 系统 中 ,所 有 的 “用 户 ” 请 求 都 能 得 到 立即 响应 , 那 是 最 理想 的 情况 。 但 是 往往 
处 理 器 的 速度 不 够 快 ,或 者 说 系统 中 的 CPU 不 够 多 ,那么 这 时 候 就 需要 系统 按照 任务 的 紧急 
程度 ,制定 不 同 的 优先 级 策略 ,设计 性 能 优秀 的 调试 算法 。 

实时 操作 系统 的 特征 如 下 。 

1、 及 时 性 

及 时 性 指 实时 系统 对 于 连续 处 理事 务 的 要 求 。 像 多 媒体 音 视 频 的 处 理 , 语 音 聊天 ,视频 会 
议 等 的 应 用 ,都 要 求 音频 .视频 在 时 间 上 连贯 ,延迟 小 。 

在 工业 控制 上 ,要 求 对 外 部 事件 的 处 理 所 能 接受 的 延迟 得 到 更 精细 的 控制 ,控制 精度 可 能 
是 毫秒 级 ,甚至 可 能 是 微 秒 级 。 : 

2， 交 互 作用 性 

交互 作用 性 指 实时 系统 对 于 人 机 的 响应 时 间 由 人 所 能 接受 的 等 待 时 间 来 确定 。 例 如 系统 
对 键盘 的 响应 ,对 于 鼠标 事件 .触摸 板 的 响应 ,对 于 窗口 变化 的 响应 等 要 求 。 

3. 多 路 性 和 独立 性 

多 路 性 和 独立 性 指 实时 系统 要 求 对 于 并 发 的 事件 作出 “同时 ”的 响应 。 从 宏观 上 来 看 ,多 
路 事件 同时 发 生 , 但 每 一 个 分 立 事件 却 保持 自身 的 独立 完整 性 。 


2.3_ 多 任务 概述 


和 计划 下 生生 下 和 和 入 直 村 入 坟 和 生生 站 大 入 和 玉生 和 和 和 生生 机 站 生生 


现代 实时 操作 系统 的 一 个 重要 特征 是 多 进程 (任务 ) 以 及 多 进程 (任务 ) 之 间 的 通信 。 在 多 
任务 环境 中 ,允许 各 个 任务 独立 并 同时 运行 ,每 个 任务 以 一 个 或 多 个 线程 分 时 使 用 处 理 器 资 
源 ,宏观 上 表现 出 在 一 台 处 理 机 上 并 行 运行 ,这 是 现代 实时 操作 系统 的 一 个 显著 特征 。 多 个 任 
务 之 间 通 过 各 种 各 样 的 通信 机 制 以 实现 任务 间 的 同步 ,从 而 协调 或 约束 彼此 之 间 的 行为 。 

实时 系统 另 一 个 非常 重要 的 特征 是 硬件 中 断 。 硬 件 中 断 机 制 使 得 实时 系统 可 以 及 时 响应 
外 部 事件 ,从 而 实现 嵌入 式 系统 的 高 度 实时 性 能 。 因 此 ,及 时 响应 和 实时 处 理 外 部 事件 便 成 为 
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嵌 人 式 系 统 设 计 的 一 个 核心 问题 。 因 而 中 断 处 理 在 嵌 人 式 系统 设计 中 是 一 个 至 关 重 要 的 
任务 。 
硬件 中 断 机 制 为 多 任务 的 实现 提供 了 物质 基础 。 


2. 3.1 进程、 线程 与 任务 


1. 进 程 

简单 地 说 ,进程 就 是 有 独立 的 程序 空间 和 进程 控制 块 , 是 一 个 独立 的 应 用 程序 , 且 有 自己 
独立 的 生命 周期 。 因 为 进程 与 进程 之 间 使 用 不 同 的 虚 地 址 空间 ,因而 不 能 简单 地 共享 内 存 变 
量 ,进程 之 间 的 通信 需要 通过 诸如 邮箱 .管道 . 套 接 字 等 方式 进行 通信 。 

多 进程 为 实时 系统 提供 了 一 个 核心 机 制 , 以 实现 对 客观 世界 中 多 个 分 立 事件 的 控制 和 响 
应 。 如 前 所 述 ,多 进程 产生 这 样 一 个 宏观 表象 , 那 就 是 多 个 进程 在 一 台 处 理 机 上 同时 运行 ;而 
事实 上 ,内核 基于 某 个 调试 算法 交织 地 让 各 个 进程 在 各 自 时 间 片 内 运行 。 每 个 进程 都 有 它们 
独自 的 上 下 文 Ccontext)。 所 谓 上 下 文 , 即 指 CPU 的 状态 ,以 及 系统 资源 。 当 每 次 内 核 调 度 到 
一 个 进程 开始 执行 时 ,内 核 便 恢复 到 该 进程 上 次 被 中 断 时 的 状态 ,而 在 内 核 将 别 的 进程 调度 为 
执行 进程 (context switch) 之 前 ,内 核 会 被 当前 进程 的 上 下 文保 存 到 栈 中 。 进 程 的 上 下 文 被 存 
放 到 一 个 称 之 为 进程 控制 块 PCB(Process Control Block) 中 。 通 常 PCB 包括 如 下 内 容 : 

国 PC 寄存 器 , 它 指示 当前 线程 正在 执行 的 位 置 ; 

国 CPU 寄存 器 ,包括 状态 寄存 器 或 浮 点 寄存 器 (如 果 有 )， 

国 运行 栈 (stack) ; 

是 标准 输入 /输出 设备 ; 

于 其 他 内 核 控 制 数据 结构 。 


2. 线 程 

线程 是 一 个 可 以 被 独立 调度 ,并 使 其 占用 处 理 器 资源 运行 的 最 小 执行 单元 。 一 个 进程 中 
必定 有 一 个 线程 , 那 就 是 主线 程 。 在 C 语言 程序 中 ,main 函 煞 所 在 的 线程 为 主线 程 。 除 了 主 
线程 ,应 用 程序 还 可 以 创建 其 他 一 些 线程 ,以 供 某 个 应 用 程序 中 多 个 事务 并 发 运行 。 

线程 有 自己 独立 的 私有 栈 , 但 是 其 程序 地 址 空间 是 整个 进程 程序 地 址 空间 的 一 部 分 , 它 与 
该 进程 的 其 他 线程 共享 同一 个 进程 虚拟 地 址 空间 ,因而 同一 进程 中 的 多 个 线程 可 以 共享 全 局 
变量 及 全 局 数据 结构 ,从 而 方便 地 实现 内 存 变 量 的 互 享 。 除 此 之 外 ,操作 系统 还 提供 了 丰 语 的 
线程 通信 机 制 , 锁 和 信号 量 就 是 经 常 使 用 的 线程 通信 机 制 。 

虽然 同一 进程 中 的 多 个 线程 可 以 共享 全 局 变量 及 全 局 数据 结构 ,但 是 考虑 到 可 重 人 的 问 
题 ,以 及 线程 所 控制 事务 的 私有 数据 ,特别 是 那些 通过 同一 代码 来 产生 多 个 线程 实例 的 情况 ， 
不 应 该 使 用 全 局 数据 ,而 应 使 用 各 个 线程 私有 的 数据 结构 ,例如 通过 一 个 open() 来 打 天 多 个 
“文件 ,每 个 被 打开 的 文件 都 有 私有 的 数据 结构 与 之 关联 。 
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3. 任 务 
某 些 操作 系统 中 使 用 了 “任务 ?的 概念 ,比如 VxWorks 操作 系统 。 任 务 有 些 像 线程 ,也 有 
些 像 进程 ,因为 在 VxWorks 早期 的 一 些 版 本 中 ,整个 操作 系统 包括 用 户 程序 共享 同一 个 虚拟 
地 址 空间 ,整个 系统 就 是 一 个 巨大 的 进程 。 

典 人 式 系统 中 , 由 于 资源 有 限 , 在 很 多 地 方 不 是 特别 区 分 线程 与 任务 的 概念 ,所 以 在 后 面 
的 讨论 中 对 于 线程 与 任务 不 作 明确 区 分 。 


2.3.2 何 时 需要 多 任务 


下 面 通过 一 个 实例 帮助 读者 理解 多 任务 或 者 多 线程 在 嵌入 式 系统 中 的 实际 应 用 。 通 过 该 
实例 ,一 方面 帮助 了 解 代 入 式 软件 设 计 中 多 任务 的 需求 ,同时 也 帮助 进一步 理解 庶 人 式 软件 体 
系 中 各 个 组 成 部 分 的 概念 。 

在 了 解 了 多 任务 的 原理 机 制 后 不 禁 要 问 ,什么 时 候 需 要 多 任务 呢 ? 听 起 来 这 是 操作 系统 
要 做 的 事情 ,与 程序 员 无 关 , 但 事实 并 非 如 此 。 

假设 要 实现 一 个 MP3 播放 器 ,要 求 从 头 到 尾 编写 该 播放 器 的 程序 。 首 先 主 程序 从 一 个 存 
储 MP3 文件 的 磁盘 中 读 取 一 小 段 数 据 ( 压 缩 的 音频 流 ), 然 后 开始 分 析 这 段 码 流 ,找到 它 一 帧 
的 帧 头 ; 接 着 开始 计算 ,并 完成 解码 ;最 后 输出 一 帧 音频 流 的 PCM 数据 。 接 下 来 把 它 送 到 声 
卡 硬 件 的 缓存 里 ,由 声卡 硬件 读 取 卡 数据 ,经 数 / 模 转换 ,从 而 发 出 音乐 声 。 

按 这 种 方式 做 硬件 功能 的 测试 是 可 行 的 ,但 接 下 来 便 会 遇 到 麻烦 ,因为 主 程序 接 下 来 又 要 
从 文件 系统 里 读 一 段 码 流 , 再 进行 解析 、 计 算 , 解 码 输 出 PCM 原始 数据 …… 由 于 读 文 件 和 解 
码 需要 时 间 , 像 这 样 运行 单一 的 顺序 执行 的 程序 就 会 出 现 解码 完 一 帧 就 马上 播放 一 帧 ,再 解码 
一 帧 ,再 播放 一 蚌 的 现象 , 便 引 起 声音 停顿 ,直观 听 起 来 ,就 是 断断续续 的 声音 

更 有 甚 者 , 当 用 户 不 想 再 听 这 种 味 吡 味 吡 的 声音 , 想 要 停止 下 来 时 , 却 无 法 于 预 中 止 程序 
的 执行 。 因 为 主 程序 在 顺序 执行 ,没有 设置 一 个 终止 点 来 接受 用 户 的 输入 ,从 而 无 法 与 用 户 进 
行 交 互 。 

仔细 分 析 一 下 ,上 面 这 个 程序 具有 局 限 性 。 其 根本 原因 在 于 程序 是 顺序 执行 的 ,或 者 说 是 
串 行 执行 的 。 主 程序 (也 就 是 整个 程序 ) 在 一 个 时 间 只 能 做 一 件 事情 , 读 文 件 时 不 能 解码 也 不 
能 向 声卡 输送 数据 ,同样 解码 时 不 能 读 文件 也 不 能 向 声卡 输送 数据 ,向 声卡 输送 数据 时 不 能 读 
文件 也 不 能 解码 。 

另 二 个 局 限 性 就 是 没有 消息 的 处 理 及 与 用 户 进 行 交 互 。 

怎样 解决 这 个 问题 呢 ? 答案 是 必须 把 整个 独立 程序 分 成 一 些 细小 的 部 件 ,让 各 个 部 件 并 
行 地 “同时 ?” 动 起 来 。 

怎样 才能 实现 并 行 呢 ? 已 经 知道 声卡 在 正常 播放 声音 时 需要 连续 不 断 地 接收 数据 才 可 以 
发 出 乐 声 。 换 名 话说 , 它 需要 得 到 连续 不 断 的 服务 。 这 需要 硬件 支持 ,否则 CPU 不 得 不 一 直 
不 停 地 向 声卡 的 FIFO 里 写 数据 。 一 个 解决 的 办 法 是 CPU 批量 地 把 一 堆 数据 放 在 一 个 比较 
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大 的 缓存 里 ,由 声卡 硬件 自己 从 这 堆 数 据 里 取 数 据 。 这 个 目前 已 经 能 够 很 容易 地 实现 ,现行 广 
泛 使 用 的 DMA 已 经 帮助 解决 了 这 个 问题 。 这 个 DMA 可 以 集成 在 声卡 的 硬件 上 ,也 可 以 在 
SoC 系统 中 包括 许多 DMA。 有 时 也 称 DMA 为 Master, 因 为 它们 可 以 像 CPU 一 样 处 理 一 些 
事务 ,但 它 不 去 实现 CPU 所 能 做 的 各 种 复杂 逻辑 功能 , 它 的 职责 只 是 完成 搬运 数据 这 一 简单 
功能 。 

现在 可 以 想象 ,在 一 个 复杂 的 SoC 系统 里 , 仅 由 单一 的 CRU 是 无 法 胜任 该 复杂 系统 中 的 
事务 处 理 的 ,无 论 它 多 快 都 不 行 。 除 了 该 CPU 外 ,系统 里 还 分 布 着 其 他 Masters ,它们 负责 一 
些 简 单 的 事务 处 理 。 就 好 比 一 个 公司 里 需要 有 总 设计 师 , 需 要 有 程序 员 ,还 需要 有 前 人 台 接 待 一 
样 的 道理 。 

所 谓 Master, 在 SoC 设计 里 常常 又 叫做 主 设备 , 它 是 可 以 申请 控制 总 线 , 并 进行 数据 传输 
的 设备 。 与 之 相对 , 另 一 类 设备 叫做 从 设备 ,英文 名 为 Slave, 它 被 动 接受 响应 。 在 事务 传输 
中 , 主 设备 和 从 设备 是 相对 应 的 两 个 设备 ,一 个 主 一 个 从 。 主 设备 根据 某 种 协议 向 系统 总 线 管 
理 器 申请 获得 总 线 使 用 权 , 然 后 开始 与 从 设备 交互 数据 。 在 交互 过 程 中 , 主 设备 还 要 产生 必要 
的 控制 信号 以 及 时 钟 信 号 。 当 一 次 数据 交互 完成 之 后 , 主 设备 立即 释放 对 系统 总 线 的 控制 权 ， 
以 备 系 统 中 其 他 总 线 主 设备 共享 使 用 总 线 。 

虽然 DMA 这 类 Masters 只 是 完成 诸如 数据 传输 这 类 简单 的 任务 ,但 是 它 却 帮 了 CPU 一 
个 很 大 的 忙 , 其 作用 远 远 超出 一 个 前 台 接 待 员 所 完成 的 功能 。 因 为 DMA 这 类 主 设 备 可 以 负 
责 一 些 简单 的 事务 ,从 而 把 CPU“* 空 出 来 ”, 以 便 处 理 其 他 事务 。 

下 面 再 来 分 析 从 一 个 文件 系统 里 读 码 流 数据 这 一 过 程 , 看 看 它 与 MP3 压缩 流 的 解码 过 程 
能 否 并 行 ? 

首先 ,从 文件 系统 里 读数 据 是 否 可 以 交 给 一 个 DMA 主 设备 去 完成 呢 ? 为 了 说 明 这 个 问 
题 , 首 先 分 析 一 下 文件 系统 与 存储 设备 的 关系 。 

1. 存储 设备 与 文件 系统 

一 个 系统 中 , 码 流 或 其 他 用 户 数据 系统 文件 和 程序 文件 都 存放 在 某 些 存 储 设 备 上 ,例如 
一 个 IDE 硬盘 CF 卡 、SD 卡 或 内 舱 在 电路 主板 上 的 Flash 存储 卡 等 。 

当 系 统 中 的 文件 和 数据 很 多 时 ,如 果 这 些 文件 或 数据 不 按 某 种 约定 方式 进行 存放 ,那么 检 
索 及 读 取 就 会 遇 到 有 麻烦。 为 此 ,需要 一 定 的 约定 方法 来 组 织 这 些 数 据 。 该 约定 方法 和 数据 组 
织 方 法 就 形成 了 一 个 文件 系统 。 组 织 方法 不 同 , 便 有 不 同 的 文件 勾 统 。 

目前 已 经 有 很 多 种 成 功 . 且 常用 的 文件 系统 ,例如 FAT16,FAT32,NTFS,UDF,JFFS2， 
等 等 。 文 件 系 统 不 是 什么 神秘 的 事物 ,任何 人 都 可 以 定义 一 个 自己 的 文件 系统 ,只 要 它 便于 读 
取 , 便 于 存储 即 可 。 但 是 并 不 推荐 自己 定义 “文件 系统 ”, 因 为 也 许 你 无 法 定义 出 一 个 完备 公理 
系统 的 结构 ;而 且 , 为 了 与 他 人 交互 ,让 他 人 编写 的 程序 能 够 正确 读 取 你 所 存 取 的 数据 ,就 必须 
使 用 通用 的 文件 系统 。 

当然 ,如 果 你 的 目的 就 是 为 了 不 通用 ,例如 为 了 加 密 , 而 不 让 别 的 用 户 或 别 的 程序 正确 获 
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得 你 所 存储 的 信息 ,那么 私有 文件 系统 是 很 起 作用 的 。 

简单 地 说 ,存储 设备 是 记录 数据 文件 的 物理 介质 ， 和 
而 建立 起 来 的 逻辑 组 织 结构 。 

在 某 个 操作 系统 中 ， 系统 核心 有 专门 的 驱动 访问 该 操作 系统 所 支持 的 特定 的 文件 系统 。 
这 个 驱动 就 是 文件 系统 驱动 。 文 件 系 统 驱 动 负责 把 用 户 的 请 求 转换 为 对 存储 介质 物理 上 的 
读 / 写 操作 ,其 任务 包括 创建 允 辑 分 区 ,创建 目录 ,创建 新 文件 ,改变 文件 或 目录 的 属性 ,向 一 个 
文件 里 写 入 、 追 加 或 读 取 数 据 , 以 及 删除 一 个 文件 或 目录 。 文 件 系 统 驱动 负责 将 应 用 程序 对 文 
件 的 操作 转换 为 相应 的 逻辑 块 (或 扇 区 ) 的 读 / 写 操作 ;文件 系统 驱动 的 内 部 数据 结构 记录 着 当 
前 打开 文件 的 一 些 私 有 数据 结构 ， 例如 文件 的 当前 读 / 写 位 置 ， 修改 日 期 ,文件 或 目录 的 使 用 权 
限 等 。 

介质 随机 存 取 文 件 系 统 的 物理 设备 通常 是 以 块 设备 来 实现 的 。 所 谓 块 设备 ,就 是 每 次 读 / 
写 以 块 为 单位 , 块 的 大 小 可 以 是 512,1 024,2 048 或 16 KB,32K 等 , 它 依赖 于 格式 化 时 用 户 的 
选择 。 

同样 ,从 存储 设备 上 读 / 写 一 个 或 多 个 数据 块 的 操作 也 可 交 由 一 个 DMA 来 完成 ， 空 ”出 
CPU 去 做 别 的 操作 。 例 如 解码 MP3 音频 流 、 等 待 用 户 的 输入 .局 动 另 外 一 个 主 设备 .处 理 硬 
件 中 断 、 在 屏幕 上 显示 动画 以 及 从 网 络 上 下 载 文件 ,等 等 。 

2. 逻辑 上 的 并 行 与 物理 上 的 并 行 

上 面 的 讨论 解释 了 在 一 个 SoC 系统 中 ,多 个 部 件 同 时 并 行 工 作 的 物理 可 能 性 。 下 面 的 讨 
论 与 通常 操作 系统 中 所 讨论 的 并 行 略 有 些 不 同 。 操 作 系 统 原理 书籍 上 讲 的 并 行 ,是 宏观 上 的 
并 行 。 从 微观 上 看 ,CPU 在 某 时 间 片 处 理 某 项 任务 ,而 在 下 一 时 间 片 执行 另 一 个 用 户 程序 ,再 
下 一 个 时 间 片 里 可 能 是 响应 并 处 理 一 个 时 钟 中 断 …… 从 宏观 上 看 ,在 一 段 时 间 内 ,多 项 任务 的 
操作 都 得 到 了 响应 ,感觉 上 是 并 行 的。 而 这 里 的 讨论 引入 了 多 个 Master( 主 设备 ,注意 到 CPU 
也 是 一 个 Master, 它 是 系统 里 最 核心 .最 重要 的 Master) ,多 个 Master 在 同一 时 间 里 可 以 做 不 
同 的 事情 ,例如 CPU 正在 执行 一 个 乘 加 的 操作 ,可 能 需要 200 个 CLK 时 钟 ,在 这 段 时 间 里 ,一 
个 总 线 主 设备 可 能 启动 了 一 个 DMA 操作 ,实现 从 物理 内 存 将 一 批 数据 搬运 到 一 个 外 部 设备 ， 
比如 一 个 声卡 的 内 部 缓冲 区 中 。 

需要 提醒 读者 注意 的 是 :两 个 主 设备 同时 工作 的 条 件 是 不 存在 资源 竞争 。 在 一 个 复杂 系 
统 里 ,多 个 总 线 主 设备 竞争 得 最 多 的 就 是 系统 总 线 。 例 如 内 存 DRAM 的 总 线 上 挂 了 很 多 主 
设备 :首先 是 CPU , 它 需 要 从 DRAM 里 读 出 指令 . 读 出 数据 . 写 人 数据 ;其 次 是 从 一 个 磁盘 文 
件 里 读 和 人 一段 码 流 或 装载 一 个 DLL 库 ;再 次 是 一 个 DMA 控制 器 可 能 会 从 一 个 网 卡 里 将 一 批 
数据 存储 到 DRAM 里 ,如 此 等 等 。 在 这 种 情况 下 ,如果 CPU 与 DMA 控制 器 同时 输出 数据 到 
所 连接 的 PRAM 数据 总 线 上 就 会 出 错 。 所 以 ,一 个 时 间 只 能 有 一 个 总 线 主 设备 使 用 该 条 总 
线 ,未 被 赋予 使 用 权 的 其 他 主 设备 就 要 等 待 。 

在 多 个 主 设备 共用 总 线 的 情况 下 ,需要 有 一 个 总 裁 控 制 器 。 总 裁 是 一 项 复杂 的 过 程 , 它 有 
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很 多 算法 来 保持 公正 和 平等 ,有 时 还 要 对 特别 请 求 采 取 不 平等 的 处 理 , 即 按照 优先 权 的 高 低 。 | 赔 


总 裁 算 法 及 其 实现 机 制 不 是 本 书 讨论 的 范畴 ,在 此 不 作 赣 述 。 8 
再 次 强调 的 是 :上 面 讨论 的 两 种 并 行 ,一 种 是 称 之 为 逻辑 上 的 或 宏观 上 的 并 行 ; 另 一 种 是 人 
称 之 为 物理 上 的 或 实际 真实 但 有 条 件 的 并 行 。 件 
因此 ,嵌入 式 系统 中 的 并 行 不 仅仅 指 宏观 的 、 逻 辑 上 的 并 行 。 由 于 存在 多 个 主 设备 ,从 微 “ | 设 
观 土 \ 物 理 上 的 并 行 也 是 存在 的 。 计 
3. 使 用 线程 志 
什么 时 候 需要 线程 ? 
考虑 如 下 伪 代 码 ， 二 
int main( ) 法 

《 
Initialize_Player ( ); 47 


User_Stoped = 0; 
while(User_Stoped == 0) 
{ 
Decode_ME3 ( ); 
Output_Rudio ( ); 
} 


return 0; 
}》 


void Player_Message_Handler ( ) 
{ 
Check_User_Input (&msg) ; 
Switch (msg) { 

CasSe USER_STOP_PLRAY ， 
User_Stoped = 1; 
break; 

default: 
break; 


} 


这 段 代码 看 起 来 没有 什么 问题 ,假如 在 Initialize_Player 中 已 经 启动 了 一 个 播放 界面 ,该 
播放 界面 就 接受 用 户 的 输入, 并 回调 Player_Message_Handier 〈 ) 来 处 理 用 户 的 输入 ,例如 前 
进 、 倒 退 、 停 止 . 暂 停 . 调 高 音量 ,等 等 。 

仔细 分 析 一 下 就 会 发 觉 一 个 问题 :假如 主 函数 main( ) 和 消息 处 理 函 数 是 处 于 同一 个 线 
程 , 在 同一 个 线程 里 的 函数 是 按 程序 编写 时 的 逻辑 关系 顺序 执行 的 , 当 程 序 进 入 到 主 函 数 的 
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while 循环 之 后 ,由 于 User_Stoped ! = 0 的 条 件 永远 得 不 到 满足 ,所 以 用 户 的 输入 也 就 没有 
机 会 被 处 理 , 从 而 User_Stoped 永远 不 会 被 改变 ,即使 此 时 用 户 按 下 了 Stop 按钮 也 无 济 于 事 。 
要 想 改变 这 种 状况 ,就 须 让 用 户 的 窗口 消息 检查 以 及 主 函 数 同 时 动 起 来 。 所 谓 同 时 动 起 
来 ,就 是 需要 某 种 机 制 使 主 函 数 运行 一 定时 间 之 后 ,让 Player_Message_Handler 也 运行 一 下 ， 
以 便 Player_Message_Handler 有 机 会 检查 是 否 有 用 户 输入 。 一 种 办 法 是 在 主 函 数 的 while 
循环 中 显 式 地 调用 Player_Message_Handler 函数 。 在 早期 的 单片机 中 就 是 采取 这 种 办 法 。 
但 是 一 个 完备 的 RISC 的 SoC 系统 里 提供 了 更 丰富 .更 通用 的 机 制 。 
显 式 调用 的 办 法 对 于 程序 量 很 小 .资源 很 少 的 单片机 来 说 完全 可 行 。 一 般 可 以 在 一 个 主 
控 函 数 里 完成 所 有 事务 的 处 理 ,在 需要 检查 是 否 有 一 个 或 多 个 事件 发 生 时 ,每 次 显 式 地 依次 调 
用 事件 检测 函数 ,如 果 有 , 则 依次 一 一 处 理 它 们 。 显 然 , 主 控 函 数 的 设计 者 需要 知道 该 系统 里 
有 多 少 个 类 似 的 检测 ,而且 主 控 函 数 需 要 准确 知道 在 哪些 地 方 该 调用 何 种 检测 。 所 以 ,这 个 主 
控 函 数 随 着 系统 的 增长 会 变 得 越 来 越 复杂 ,逻辑 会 变 得 越 来 越 乱 ,维护 会 越 来 越 困 难 。 
而 在 支持 多 线程 的 系统 中 ,即使 是 一 个 极其 简单 的 操作 系统 平台 ,也 只 须 将 需要 并 行 的 两 
个 或 多 个 任务 放 在 不 同 的 线程 中 ,就 可 以 很 容易 地 解决 这 个 问题 。 使 用 多 线程 实质 上 是 把 由 
一 个 主 控 程 序 进行 集中 管理 转化 为 由 各 个 线程 进行 各 自分 立 管 理 , 使 用 线程 间 的 同步 机 制 和 
分 时 调度 机 制 来 实现 并 行 运行 以 及 各 个 任务 间 的 协同 工作 。 
首先 来 说 ,操作 系统 会 给 每 一 个 运行 的 程序 启动 一 个 主线 程 , 它 就 是 程序 的 人 口 ,通常 是 
用 户 程序 的 main 函数 。 主 线程 启动 运行 之 后 ,就 会 与 系统 中 的 其 他 程序 一 起 按照 系统 中 所 定 
义 和 申 请 的 优先 原则 轮流 被 CPU 执行 。 而 在 一 个 程序 内 部 ,主线 程 还 可 以 创建 其 他 子 线程 ， 
子 线程 一 旦 被 创建 ,就 享有 与 主线 程 同等 的 被 运行 的 权利 ,也 就 是 可 以 被 分 时 调度 。 所 以 在 上 
述 例子 中 ,只 须 为 Player_Message_Handler ( ) 创 建 一 个 子 线程 即 可 。 修 改 程序 如 下 : 
;int main ( ) 
Initialize Player ( ); 
User_Stoped = 0; 
Create_Thread (&Player_Message_Handler)# 
while(〈(User_Stoped == 0) 
{ 
Decode_MP3(〈 ); 
Output_Rudio ( ); 
了 
Teturn 0 


} 


void Player_Message_Handler () 


{ 
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Check_User_Input (&msg) ; 
Switch (msg) { 
casSe USER_STOP_PLRY 
User_Stoped = 1; 
break; 
defaujlt: 
break; 


} 


“Create_Thread (人 扩 Player_Message_Handler);?” 语 句 的 作用 是 创建 一 个 新 线程 ,其 人 口 
是 Player_Message_Handler 函数 的 起 始 地 址 。 

现在 对 于 这 个 Player 的 例子 , 它 在 系统 里 有 了 两 个 相互 独立 的 被 执行 实体 。 这 里 所 说 的 
独立 , 指 它们 可 以 被 CPU 以 互 不 牵连 的 关系 随机 调用 某 个 执行 实体 。 当 然 , 它 们 之 间 彼 此 也 
有 联系 ,例如 ,它们 的 编 址 属于 同一 个 程序 虚 地 址 空间 ,它们 共享 很 多 内 存 变 量 ,如 User_ 
Stoped。 这 些 线程 中 的 关系 与 进程 不 同 , 后 面 章节 中 将 进一步 讨论 多 线程 与 多 进程 之 间 的 
差别 。 

4. 线程 间 的 通信 一 一 同步 与 互 斥 

上 面 例子 中 将 一 个 单独 的 程序 分 立成 两 个 有 机 的 部 件 , 各 个 部 件 相 对 独立 。 之 所 以 称 之 
为 独立 ,是 因为 它们 可 以 各 自 独 立地 被 CPU 调度 ,而 没有 时 间 和 逻辑 上 的 前 后 关系 ,其 中 之 
一 的 部 件 何 时 被 调度 运行 ,完全 取决 于 系统 的 调度 程序 以 及 系统 当时 的 状况 。 由 此 看 出 ,线程 
的 引入 “ 打 乱 ”了 程序 执行 的 顺序 性 。 

当 引 和 人 多 线程 时 注意 到 ,这 个 分 离 导 致 两 个 新 问题 : 

第 一 ,原来 封闭 且 顺 序 执行 的 程序 ,现在 变 成 了 分 离 的 两 个 部 件 , 成 为 开放 且 不 顺序 执行 
的 程序 ,一 个 独立 程序 的 各 个 部 分 可 能 不 再 按照 预想 的 先后 顺序 被 执行 。 例 如 ,不 再 是 部 件 A 
被 调度 一 次 后 紧 跟 着 调度 部 件 B; 而 可 能 是 在 某 个 时 间 内 A 被 调度 了 2 次 ,而 B 只 被 调 1 次 ， 
或 者 1 次 也 没 被 调度 ,反之 亦 然 。 

第 二 ,两 个 部 件 之 间 需 要 进行 交互 , 即 需要 在 两 个 部 件 之 间 传 达 状 态 信息 和 交换 数据 ,也 
即 常 说 的 线程 通信 。 

下 面 旨 在 解决 第 二 个 问题 : 

在 上 面 的 例子 中 ,事实 上 已 经 使 用 了 一 个 内 存 变量 ,来 在 两 个 部 件 中 传达 一 个 简单 的 信 
息 , 以 根据 用 户 的 输入 请 求 来 改变 一 个 状态 量 。 但 是 ,这 种 通过 内 存 变量 来 传递 的 信息 是 不 
够 的 。 

如 果 一 个 线程 A〈 以 下 还 是 称 “ 部 件 ? 为 “线程 ”需要 另 一 个 线程 B 来 提供 后 面 处 理 的 必 
要 条 件 , 若 这 个 必要 条 件 没 有 准备 就 绪 , 则 线程 A 就 要 等 待 。 在 这 种 情况 下 ,线程 A 可 能 需要 


第 2 章 多 任务 操作 系统 


不 停 地 检测 内 存 的 变化 ,这 样 就 浪费 了 CPU 的 处 理 时 间 ( 此 时 线程 A 作为 一 个 独立 运行 体 ， 
一 有 旦 被 调度 ,就 全 速 运行 ), 从 骨 入 式 设 备 的 角度 来 说 , 它 还 消费 功 耗 。 一 个 解决 的 办 法 是 让 线 
程 A 休眠 ,而 当 线程 B 为 线程 A 准备 就 绪 之 后 , 才 主 动 唤醒 A。 这 样 做 既 可 以 节省 CPU 处 理 
器 的 时 间 ,提高 处 理 器 处 理 其 他 事务 的 能 力 ,满足 实时 性 的 需求 ,又 可 以 节省 功 耗 。 


2.3.3 任务 状态 的 转换 


内 核 维 护 着 各 个 任务 当前 的 状态 ,应 用 程序 调用 内 核 函 数 使 得 进程 由 一 个 状态 转换 到 另 
一 个 状态 (state transition) 。 当 一 个 新 的 任务 被 创建 时 , 它 处 于 挂 起 状态 。 一 个 新 创建 的 任务 
必须 在 被 激活 时 才 转 人 就 绪 状 态 。 激 活 的 过 程 相当 快 , 从 而 允许 应 用 程序 预先 创建 任务 ,然后 
按时 间 顺 序 依次 激活 一 系列 任务 。 创 建 任务 的 另 一 方法 是 使 用 Spawning 原 语 , 它 允许 任务 
的 创建 与 激活 过 程 仅 使 用 一 个 函数 来 完成 。 任 务 可 以 在 任何 时 刻 被 删除 。 

VxWorks 是 基于 任务 来 调度 的 ,图 2- 1 显示 了 VxWorks 中 的 任务 状态 转换 图 。 


Teady 
ready 
Teady 
pended 
pended 
deliayed 
delayed 
Suspended 
Suspended 
Suspended 


taskInit( ) 


pended 
delayed 
SuUspended 


CC 


suspended 


semTake( ) / msgQReceived( ) 
taskDelay( ) 

taskSuspendft ) 

semGive( ) /msgQsend( ) 
teakSuspend( ) 

expired delay 

taskSuspend( ) 

taskResumet ) /taskActivated( ) 
taskResumef ) 

taskResume( ) 


2-1 VxWorks 中 的 任务 状态 转换 图 


由 这 个 状态 转换 图 可 以 看 到 , 当 程 序 中 执行 某 些 系 统 调 用 的 时 候 , 由 于 一 些 任务 运行 所 需 
的 状态 或 资源 不 能 立即 获得 ,程序 将 无 法 继续 向 下 执行 ,需要 等 待 其 他 任务 准备 好 或 处 理 好 一 
些 数据 ,或 释放 一 些 系统 资源 后 ,该 任务 才能 继续 向 下 执行 ,这 个 时 候 , 该 任务 就 转 人 到 挂 起 或 


被 延 时 的 状态 。 
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2.3.4 进程 调度 与 调试 算法 


在 一 个 系统 中 有 多 个 进程 同时 运行 ,它们 共享 CPU 资源 以 及 一 些 外 部 资源 。 有 很 多 算 
法 来 分 配 这 些 资源 以 使 某 个 进程 当前 占有 CPU 而 处 于 运行 状态 。 

1， 基 于 时 间 片 轮转 的 调试 算法 

基于 时 间 片 轮转 的 调试 算法 是 一 种 普遍 的 简单 调试 算法 。 

2. 基于 优先 级 的 调试 算法 

在 一 些 实时 性 要 求 很 离 的 系统 内 ,各 个 任务 分 优先 等 级 ,在 同等 条 件 下 ,优先 等 级 高 的 进 

基于 优先 级 的 算法 是 在 一 个 进程 的 时 间 片 内 完成 , 当 调 度 到 新 的 任务 并 准备 运行 时 ,首先 
会 比较 就 绪 状 态 队 列 中 各 个 进程 的 优先 级 ,然后 选择 优先 级 别 高 的 进程 作为 下 一 个 运行 进程 。 

3. 抢占 式 优先 级 调试 算法 

与 单纯 基于 优先 级 算法 不 一 样 的 是 ,基于 抢占 式 优先 级 的 调度 算法 是 当 有 新 的 紧要 任务 
进程 时 会 打 断 当前 进程 的 执行 ,而 执行 优先 级 别 更 高 的 进程 。 

但 是 ,如 果 一 个 系统 中 一 直 有 优先 级 高 的 进程 ,那么 那些 优先 级 别 低 的 进程 将 永远 得 不 到 
响应 服务 ,从 而 会 被 " 饿 死 ”, 所 以 对 于 有 优先 级 别 的 调度 系统 中 ,如 何 快速 响应 实时 性 ,同时 又 
要 兼顾 优先 级 别 低 的 进程 ,是 系统 设计 中 所 面临 的 挑战 。 

另 一 方面 ,如 果 一 个 高 优先 级 的 进程 需要 等 待 某 个 低 优先 级 的 中 间 状 态 结果 ,或 等 待 低 优 
先 级 进程 正在 占用 的 某 个 资源 时 ,可 能 会 造成 死 锁 。 

总 之 ,基于 优先 级 的 算法 很 好 地 满足 了 实时 性 的 要 求 , 但 另 一 方面 ,系统 软件 以 及 应 用 软 
件 都 必须 精心 设计 ,以 实现 系统 中 的 各 个 部 分 协同 工作 。 


2.3.5$ 任务 相关 的 API 
与 任务 (或 线程 ) 相 关 的 管理 包括 任务 的 创建 .删除 和 控制 。 


1. 任务 (线程 7) 的 创建 
在 VxWorks 中 ,任务 的 创建 是 由 API 函数 taskSpawn() 来 实现 的 ,其 原型 定义 如 下 ， 


taskID tasSkSpawmn (name,priority,options,stacksizeymainyargl1，…… argl0)， 


taskSpawn( ) 创 建 一 个 新 任务 的 上 下 文 , 这 个 例 程 包括 分 配合 适 的 工作 栈 ,设置 任务 运行 环 
境 ,并 用 指定 的 参数 main 调用 新 任务 的 和 人口 函数 ,新 的 任务 就 从 这 个 指定 函数 的 人 口 开 始 执行 。 
taskSpawn( ) 包 含 了 创建 任务 的 底层 (低级 别 的 ?处 理 过 程 : 为 新 的 任务 分 配 存储 空间 ,初始 任务 
以 及 激活 新 任务 。 这 些 低 级 别 的 函数 也 可 以 由 显 式 调用 taskImnit( ) 和 taskActivate( ) 来 实现 ,但 
除非 需要 特别 强 的 控制 ,通常 情况 无 需 手动 完成 这 些 调用 ,taskSpawn( ) 会 自动 处 理 。 


第 2 章 多 任务 操作 系统 


在 Linux 系统 中 ,线程 的 创建 是 由 API 函数 pthread_create() 来 实现 的 ,其 原型 定义 
如 下 


int pthread_create ( pthread t+t ”* thread,const pthread_attr 七 < attryvoidx 〈x Start_routine) 


(voidx )，voidx arg); 


pthread_create() 函数 用 来 创建 一 个 新 的 线程 ,其 属性 由 参数 attr 指定 。 线 程 创建 后 ,使 
用 args 参数 调用 start_routine( ) 开始 执行 新 的 线程 。 

2. 任务 (线程 ) 的 退出 

在 VxWorks 中 ,exit( ) 调 用 将 终结 当前 任务 ,并 释放 内 存 ( 仅 仅 是 任务 工作 栈 和 任务 控制 
块 所 占用 的 内 存 ) 。 一 个 任务 可 以 在 任何 时 候 显示 地 调用 exit( ) 以 终止 它 自 身 。 

Linux 下 使 用 pthread_exit ( ?退出 来 终止 自身 。 

3. 任务 (线程 ) 的 删除 

在 VxWorks 中 ,exit( ) 用 来 显示 地 终止 任务 本 身 , 而 taskDelete( ) 可 以 由 一 个 任务 来 终 
止 别 的 任务 。 

Linux 下 使 用 pthread_cancel( pthread_t id) 来 显示 删除 一 个 线程 。 

尽管 任务 可 以 在 任何 时 候选 择 终止 ,但 应 用 软件 设计 时 必须 选择 合适 的 时 机 。 一 个 任务 
在 退出 或 被 另 一 个 任务 删除 之 前 必须 确保 它 所 共享 的 资源 被 有 效 地 释放 。 

例如 一 个 任务 可 能 使 用 了 一 个 信号 量 (semaphore) 来 限制 访问 某 些 互 斥 访问 的 数据 结 
构 。 如 果 这 个 任务 正在 执行 临界 区 访问 时 被 另 一 个 任务 删除 掉 , 由 于 这 个 任务 无 法 完成 临界 
区 的 访问 , 则 临界 数据 结构 可 能 残留 为 不 完整 的 状态 。 更 进一步 ,因为 这 个 信号 量 没有 被 释 
放 , 所 以 这 个 临界 资源 再 也 不 能 被 其 他 任务 所 访问 ,从 而 被 冻结 。 

在 VxWorks 中 ,taskSafe( ) 用 于 阻止 外 部 任务 在 不 合适 的 时 候 意外 删除 一 个 任务 。 它 像 
一 把 锁 , 与 之 相对 的 taskUnsafe( ) 用 以 解除 禁止 。 

下 面 是 在 任务 中 使 用 临界 区 的 一 段 代 码 , 它 说 明 如 何 安全 保护 一 个 任务 不 被 意外 删除 ; 

taskSafe( )3; // 任 务 被 加 锁 , 直 到 调用 taskSnsafe 解锁 


/#x 阻 塞 任务 ,直到 可 以 获得 信号 量 * / 
semTajke (semId,WRIT_FOREVER) ; 


; // 访 问 临界 区 
senGive(SemId) ; // 释 放 信 号 量 , 以便 其 他 任务 使 用 临界 区 
taskUnsafe( )? // 直 到 调用 taskUnsafe 之 前 ,任务 不 会 被 意外 删除 


4. 任务 (线程 ) 的 控制 
任务 的 控制 包括 任务 的 挂 起 唤醒、 重新 开始 、 延 时 等 待 和 休眠 等 。 


Task Control Routines Description 
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taskSuspend( ) Suspend a task ( 挂 起 一 个 任务 ) 

taskResune( ) Resume a task (重新 继续 执行 一 个 任务 ) 

taskRestart( ) Restart a task《〈 重 新 从 头 开始 一 个 任务 ) 

taskpDelay( ) Delay a tasky,delay units are ticks〈 延 时 一 个 任务 , 延 时 单位 是 “ 滴 呈 2) 

nanosleep( ) Delay a task,delay units are nanoseconds( 延 时 一 个 任务 , 延 时 单位 是 “ 纳 秒 ”-- 
十 亿 分 之 一 秒 ) 


24 _ 进 程 间 共享 代码 与 可 重 入 性 _ 


2.4.1 共享 代码 


在 一 个 实时 操作 系统 中 ,常常 维护 一 个 子 函数 .或 子 函 数 库 的 单一 复制 , 它 ( 们 ?可 以 被 大 
量 不 同 的 任务 所 调用 。 例 如 许多 任务 可 以 调用 printt( ) ,但 系统 中 只 有 一 份 printf( ) 的 实现 。 
单一 的 代码 复制 被 多 个 任何 调用 执行 , 称 之 为 共享 代码 。 共 享 代码 使 得 一 个 系统 的 代码 更 加 
高 效 和 便于 维护 。 

共享 代码 必须 是 可 重 人 的 。 可 重 人 人 性 是 指 : 单 一 的 函数 执行 体 , 可 以 被 多 个 任务 根据 各 个 
任务 自身 的 上 下 文 同 时 执行 ,而 不 会 发 生 冲 突 ,就 可 以 说 ,这 个 函数 执行 体 是 可 以 (被 多 个 任 
务 ) 重 人 的 。 发 生 冲 突 的 原因 常常 是 函数 修改 了 全 局 变量 或 静态 变量 。 由 于 局 部 变量 是 在 各 
个 执行 任务 的 栈 上 分 配 的 ,所 以 一 个 任务 修改 了 局 部 变量 并 不 影响 别 的 任务 的 执行 。 

动态 链接 库 必 须 是 可 重信 的 ,IO 和 驱动 中 的 例 程 也 要 求 必 须 是 可 重 人 的 ,同时 应 用 程序 

应 该 充分 考虑 这 些 问题 ,精心 设计 。 


2.4.2 共享 代码 可 重 入 性 问题 
有 许多 函数 是 纯 代码 (pure code) 及 纯 过 程 处 理 函 数 。 它 们 除了 工作 过 程 中 使 用 动态 栈 


变量 (Dynamic Stack Variables) 之 外 ,没有 静态 的 数据 或 全 局 变量 ,这 种 函数 是 可 重 人 的 ,多 


个 任务 可 以 同时 执行 一 个 函数 而 不 会 互相 干扰 。 

包含 全 局 变量 或 兰 态 变 量 的 过 程 不 是 纯 代码 ,因为 它们 会 记录 一 个 任务 在 执行 这 个 函数 
时 的 中 间 结 果 或 状态 。 这 些 中 间 结 果 或 状态 是 与 特定 的 任务 相关 的 ,如 果 另 一 个 任务 执行 时 
与 这 些 全 局 变量 或 静态 变量 中 保存 的 中 间 结 果 的 状态 不 一 致 时 , 便 出 现 相 互 于 扰 ,从 而 导致 错 
误 结 果 。 

下 面 看 一 个 实际 例子 ,并 说 明 如 何 把 一 个 不 可 重信 的 代码 改变 为 可 重 人 的 。 

考察 如 下 代码 片段 


int dev_base; 
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voljid init_device (int base) 
{ 
dev_base = base; 
》 
Short gat_value( int off) 


人 
Int port = dev_base + off; 
return 关 《Short x ) (Port); 


My Driver 


GD dev_base = 0x10020000 
@ dev_base = 0x10040000 


Set_base(){… 上 } 


5 光 本 
get_yalue( ){port.…} 


set base (0x10020000); set base (0x10040000); 


get_value (0x08); 
/port address 上 ERROR 


get_value (0x20); 
/port address OK 


图 2-2 驱动 中 的 可 重 入 性 问题 ! 


这 段 代码 用 来 从 一 个 地 址 端口 读 取 一 个 16 位 数据 。 地 址 端口 的 基 址 通过 init_device( ) 


来 设置 。 


假设 一 个 系统 中 有 两 个 同类 设备 ,例如 两 个 串口 ,一 个 用 于 显示 调试 信息 ,一 个 用 于 从 主 
机 下 载 或 进行 其 他 数据 的 传输 ,它们 的 起 始 地 址 分 别 为 BASE_ADDRS_DEV0,BASE_AD- 
DRS_DEV1。 这 两 个 设备 就 不 能 共享 包含 上 面 这 样片 段 的 驱动 ,因为 它们 使 用 了 一 个 全 局 变 
量 保存 设备 的 起 始 地 址 。 在 这 种 情况 下 ,只 有 最 后 初始 化 dev_base 的 任务 可 以 得 到 正确 的 端 


口 值 。 
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2.4.3 ”使 用 私有 数据 
为 了 使 上面 的 驱动 可 以 重 入 ,必须 消除 对 全 局 变量 的 依赖 ,但 是 设计 者 又 不 希望 每 次 传人 | 次 
一 个 基地 址 作为 函数 参数 ,而 希望 驱动 记 住 该 设备 的 一 些 特性 值 , 那 该 怎么 办 呢 ? 性 


通常 做 法 是 对 于 每 一 个 设备 都 设置 它 的 私有 数据 内 存 区 ,以 便 存 储 私 有 的 数据 结构 。 一 设 
般 , 需 要 为 每 一 个 新 创建 的 设备 动态 分 配 私有 数据 区 ,通常 是 从 系统 堆 里 分 配 的 。 为 此 ,需要 ， 
对 驱动 作 如 下 修改 ,注意 到 create_device() 函数 中 的 kmalloc() 调 用 为 新 创建 的 设备 分 配 私有 革 


数据 内 存 区 。 想 
Se ee 
typedef struct “_tag_dev_data { - 方 
int dev_basei; > 去 
Int dev_flags; 

int dev_datas; 55 

char x* DMR_buffery， 

// 这 里 可 以 添加 其 他 数据 元 素 


) MY_DEV_DRTR; 


int init_device(MY_DEV_DRTRx pdev， dev_ id) 
{ 
Switch (dev_ id) { 
case MY_DEVO ， 
pbdev - >>dev_base = BRSE_RADDRS_DEVO0; 
break; 
Case MY_DEV1 
pdev - >dev_base = BRSE_RDDRS_DEV]1; 
break; 
default : 
return ERRORI; 
}》 
return SUCCESS; 


nt Create_device (filex fp， int dev_ id) 


MY_DEV_DRTA x* pdev; 


pbdev = (MY_DEV_DRTRx* ) kmolloc (sizeof (MY_DEV_DRTR)》 ); 
if (pdev == NULL) 
Teturn ERROR; 


fp-private = pdev; 
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return init_device (pdev， dev_id) ; 

} 

Short gat_value(filex fp， int off) 

《 

MY_DEV_DRTR x* pdev = fp- 盖 privatej; 
Int port = pdev 一 二 dev_base + off; 
Teturn “” 关 (Short x )(port); 

》 


经 过 这 样 的 处 理 之 后 ,各 个 设备 的 访问 不 再 互相 干扰 ,从 而 解决 了 驱动 的 重信 性 问题 。 


kenel_heap 


My7Driver 


本 | 
getvalue ( ){port…} 


createdevice(0); createdevice(1 ); 


get_ Value (0x08); 


get_value (0x20); 
// port address OK 


// port address OK 


2-3 驱动 中 的 可 重 入 性 问题 2 
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2.4.4 使 用 临界 区 数据 


在 上 面 的 例子 中 ,两 个 硬件 设备 不 仅 在 轩 辑 上 独立 ,而 且 物 理 上 也 是 独立 的 ,所 以 只 要 对 
个 别 的 物理 设备 使 用 分 离 的 数据 结构 就 解决 了 问题 。 

但 是 对 于 只 有 一 个 物理 设备 的 情况 ,这 种 办 法 仍然 不 凑 效 。 在 这 种 情况 下 ,希望 每 个 应 用 
分 时 享用 该 物理 设备 ,在 应 用 程序 访问 一 个 物理 设备 的 期 间 , 必须 保持 该 物理 设备 的 状态 完 
整 ,而 不 为 其 他 应 用 程序 所 破坏 。 为 此 需要 使 用 互 斥 访问 物理 设备 的 机 制 。 

对 于 这 种 情况 ,仍然 可 以 使 用 全 局 变量 或 静态 变量 , 当然 也 可 以 在 设备 创建 时 ,在 系统 内 
存 中 动态 分 配 ,但 是 这 些 变量 需要 通过 加 锁 的 方式 为 特定 的 应 用 进行 保护 。 

上 面 的 讨论 说 明了 如 何 使 用 进程 与 线程 ,如 何在 内 核 设 计 中 设计 正确 的 可 重 人 的 代码 。 
接 下 来 将 讨论 进程 间 的 相互 交互 及 其 实现 方法 。 


2.5 线程 间 通 信 


线程 间 通 信人 允许 独立 任务 间 相 互 协同 它们 的 行为 。 
通常 有 如 下 的 线程 间 通 信 的 机 制 : 

于 共享 内 存 ”用 于 简单 的 数据 共享 ; 

量 信号 量 ”基本 的 互 床 和 同步 ; 

天 消息 队列 ”在 一 个 CPU 内 的 进程 间 的 消息 传递 ; 
国 管道 ”进程 间 的 大 量 信息 传递 ; 

国 套 接 字 和 远程 过 程 调 用 网络 间 的 进程 通信 ; 
国 信号 (Signals) 用 于 处 理 异 常 。 


2.S.1 共享 数据 结构 


共享 数据 结构 即 是 共享 内 存 空间 的 通信 方式 。 共 享 数据 结构 是 一 种 最 简单 .最 直接 的 通 
信和 方式, 而 且 它 是 其 他 进程 通信 的 基础 。 无 论 什 么 样 的 通信 方式 ,最 终 是 在 内 存 一 级 实现 信息 
交互 的 。 

由 于 不 同 的 进程 有 自己 独立 的 虚拟 地 址 空间 ,所 以 共享 数据 结构 只 适用 于 一 个 进程 中 的 
线程 之 间 。 在 某 些 蔡 入 式 操 作 系统 中 ,例如 VxWorks 或 ucLinux, 整 个 系统 使 用 单一 的 虚拟 
地 址 空间 ,在 这 种 情况 下 ,共享 数据 结构 仍然 是 可 行 的 。 

共享 内 存 变 量 在 许多 情况 下 存在 局 限 性 ,除非 它 是 代表 全 局 公用 的 变量 。 如 前 面 的 讨论 
所 述 ,对 于 许多 重 人 性 问题 ,需要 使 用 私有 数据 区 进行 隔离 ,即使 使 用 内 存 变 量 共 享 的 方式 也 
一 样 。 为 了 保证 访问 的 顺序 性 和 系统 的 完整 性 ,共享 数据 的 访问 应 该 加 锁 , 使 得 一 个 时 刻 只 有 
一 个 任务 对 共享 数据 进行 访问 。 
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把 多 个 相关 联 的 共享 数据 组 织 在 一 起 ,定义 一 个 数据 结构 ,会 方便 管理 和 维护 。 可 以 使 用 
信号 量 或 锁 操 作 来 实现 临界 访问 。 下 面 以 信号 量 为 例 来 进行 分 析 , 使 用 锁 操 作 的 机 制 类 同 。 
下 面 是 一 些 共享 数据 结构 的 例子 : 


1， 生 产 者 与 消费 者 


生产 者 - ostwier 下 


缓冲 区 长 度 


HL 循环 缓冲 (Ring Buffen 


> 写 指针 
消费 者 - taskReader 


图 2-4 使 用 共享 数据 区 访问 临界 区 的 例子 
于 是 可 以 定义 类 似 的 RINGBUFF 数据 结构 。 


typedef ”struct ringbuff{ 
Char x< basehddrs; 


It buffLens; 

char 关 WPtr; 

Char x ZdPtT; 
》RINGBUEF ; 


对 于 单 CPU 体系 而 言 , 由 于 rdPtr 只 册 taskReader 来 修改 ,wtPtr 只 由 taskWriter 来 修 
改 , 所 以 两 个 任务 间 无 需要 任何 互 斥 机 制 来 访问 这 个 Ring-Buffer。 但 必须 注意 的 是 ,task- 
Writer 必须 在 向 Buffer 里 写 人 数据 之 后 再 更 新 写 指 针 , 同 理 taskReader 也 必须 在 从 Buffer 
里 读 出 数据 之 后 再 更 新 读 指针 ,否则 会 导致 数据 还 未 读 出 就 被 新 的 写 操作 覆盖 的 情况 。 因 此 
在 临界 区 数据 访问 时 必须 非常 小 心 ,如 果 使 用 互 斥 的 机 制 来 分 别 访问 ,就 可 以 避免 这 种 朴 忽 。 

2. 多 个 生产 者 或 多 个 消费 者 

如 果 有 多 个 生产 者 或 多 个 消费 者 时 ,情形 就 有 所 不 同 。 这 样 ,两 个 或 更 多 的 taskReaders 
(或 是 threadReaders) 存 在 于 一 个 系统 中 ,它们 会 从 同一 个 Buffer 里 取 数 据 , 并 且 更 新 读 指针 。 
如 果 一 个 任务 在 读 的 时 候 系统 调度 到 另 一 个 任务 , 则 先前 执行 读 操 作 的 taskReader 还 没 来 得 
及 更 新 读 指针 ,而 新 的 taskReader 会 使 用 老 的 过 时 的 读 指 针 来 读 取 数 据 。 如 果 先 前 的 读 任务 
已 经 更 新 了 读 指 针 , 则 新 的 taskReader 会 读 人 未 使 用 过 的 数据 ,由 此 在 这 个 系统 中 便 出 现 不 
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可 预见 性 。 写 的 情况 也 与 之 类 似 。 因 此 为 了 使 RINGBUFF 的 设计 更 加 通用 ,无 论 系统 中 有 
多 少 个 taskReader(s) ,或 多 少 个 taskWriter(s) ,系统 可 以 依然 正确 执行 ,设计 者 需要 对 Buffer 
本 身 , 以 及 Buffer 相关 的 指针 进行 临界 区 域 保 护 , 以 确保 一 个 时 期 只 有 一 个 同类 型 的 任务 对 
Buffer 进行 操作 。 


2.$.2 互 斥 


在 共享 一 个 地 址 空间 时 可 以 非常 简单 地 交互 数据 。 但 对 内 存 的 互 锁 访问 非常 关键 ,以 避 
免 相 互 间 的 竞争 。 有 很 多 种 方法 可 以 实现 互 斥 访问 ,它们 的 区 别 在 于 排斥 的 范围 不 一 样 。 

国 : 禁 止 中 断 ; 

国 禁止 抢占 ; 

入 使 用 信号 量 对 资源 加 锁 。 

1. 禁止 中 断 

这 是 一 种 非常 强 有 力 的 互 斥 机 制 。 由 于 系统 的 调度 依赖 于 时 钟 中 断 , 所 以 禁止 中 断 可 以 
确保 临界 区 的 访问 不 会 被 中 断 , 从 而 使 该 任务 得 以 对 资源 的 独自 访问 。 


taskR { 志 


7 
int lock = intbock( ); 
//… 临界 区 :对 于 该 区 域 的 执行 不 会 被 任何 硬件 中 断 所 打 断 
intUnlock (lock) ; 
2 
》 
上 面 这 种 方法 由 于 禁止 了 中 断 , 所 以 将 会 导致 外 部 事件 得 不 到 及 时 的 响应 。 在 实时 性 要 
求 很 高 的 系统 里 ,这 种 方法 是 不 可 取 的 。 
2. 禁止 抢占 
禁止 抢占 是 指 禁 止 当 前 的 任务 不 会 调度 到 别 的 任务 ,直到 当前 任务 自己 解除 禁止 抢占 。 
在 禁止 抢占 期 间 , 只 是 禁止 了 进程 调度 不 会 调度 到 别 的 任务 ,但 中 断 服 务 是 可 以 执行 的 ,所 以 
禁止 抢占 比 禁止 中 断 的 限制 条 件 要 弱 。 
七 aSKR { 
WA ae sen 
taSkLock( ); 
// … 临 界 区 :对 于 该 区 域 的 执行 不 会 被 任务 抢占 所 打 断 
taskUnlock ( ); 
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禁止 抢占 对 系统 的 实时 性 仍然 有 很 大 的 影响 ,在 禁止 任务 被 抢占 期 间 ,即使 优先 级 别 高 的 
任务 或 线程 也 得 不 到 服务 ,所 以 将 会 影响 系统 的 性 能 。 

无 论 娜 种 情况 ,都 应 该 确保 被 “禁止 ?的 时 间 尽 可 能 短暂 ,以 确保 由 此 导致 的 时 延 不 会 对 整 
个 系统 产生 太 多 的 影响 。 

3. 使 用 信号 量 对 资源 加 锁 

下 面 小 节 将 对 此 进行 专门 讨论 。 这 是 一 种 非常 有 效 ,并 对 系统 其 他 部 分 产生 最 小 影响 的 
方法 。 


2.5$.3 信号 量 


信号 量 (semaphores) 是 用 来 解决 同步 和 互 斥 的 最 根本 的 方法 ,在 系统 设计 以 及 多 任务 环 
境 下 ,应 用 程序 的 设计 都 将 会 大 量 使 用 到 。 

互 斥 一 一 信号 量 加 锁 的 办 法 来 实现 对 共享 资源 的 互 斥 访问 。 

同步 一 一 使 用 信号 量 来 协同 任务 间 的 执行 ,等 待 一 个 外 部 条 件 得 以 满足 之 后 再 行 继续 
执行 


下 面 讨 论 两 种 基本 类 型 的 信号 量 。 
1. 二 值 信 号 量 
二 值 信 号 量 可 以 看 作 是 一 个 标志 (flag) , 它 主 要 用 于 任务 间 的 互 斥 与 同步 ,两 者 在 使 用 上 
是 很 类 似 的 ,只 有 细微 的 差别 。 下 面 将 解释 二 者 间 的 善 别 : 

在 互 斥 的 情况 下 ,二 值 信号 量 在 创建 时 被 初始 化 为 1(SEM_FULL) ,然后 任何 一 个 任务 
可 以 通过 系统 调用 semTake( ) 获 得 这 个 信号 量 , 并 置 该 信号 量 为 0(SEM_EMPTY) ,以 阻止 
其 他 任务 获得 这 个 信号 量 , 从 而 掌控 了 使 用 临界 资源 的 权利 。 如 果 一 个 任务 想 获得 信和 号 量 ,而 
这 个 信号 量 的 值 为 0(SEM_EMPTY) ,那么 这 个 任务 就 被 阻塞 。 当 一 个 任务 完成 对 临界 资源 
的 访问 后 ,必须 尽快 释放 信和 号 量 , 以 备 其 他 任务 访问 临界 资源 。 在 释放 信号 量 的 系统 调用 
(semGive( )) 中 ,如 果 发 现 有 被 阻塞 的 任务 ,将 会 唤醒 阻塞 任务 队列 中 的 第 一 个 任务 ,让 它 拥 
有 这 个 信号 量 ,并 保持 信和 号 量 的 值 继续 为 0(SEM_EMPTY); 和 否则 ,如 果 没 有 被 阻塞 的 任务 , 则 
置信 号 量 的 值 为 1(SEM_FULL), 以 后 别 的 执行 任务 可 以 获得 这 个 信和 叶 量 及 资源 的 使 用 。 
下 面 例子 显示 信号 量 在 互 斥 中 的 使 用 ， 


[] 关 兴 头 关头 尖 闪闪 尖 凑 关 关 关头 关 关 尖 关 关 尖 关 尖 闪闪 其 凑 关 


// 主任 务 

[关头 关 尖 关 关 关 尖 兴 闪闪 关头 并 尖 关 关头 关头 尖 尖 尖 尖 尖 关 凑 
RINGBUFE zingBuff; 

SEM_ID SemRingBuff; 


int main ask(…) 
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{ 
// 在 调用 SemTake 或 SemGive 之 间 ,信号 量 必 须 首先 被 创建 ,所 以 首先 在 主任 务 中 创建 它 
semRingBuff = SemBCreate (SFEM_Q_PRIORITY， SEM_FULL) ; 


// 产生 一 些 新 的 子 任务 

taSskID1 = taskSpasm (… ， taskl_nmain_func，…)5 

} 

NA] 关头 关 关头 六 尖 尖 关头 尖 关 类 尖 关 尖 关 尖 关 凑 尖 苏 尖 次 凑 关 凑 关 关 闪闪 类 闪闪 闪闪 关 
// task 1# ,or task 2 井 〈 任 务 1 号 ,或 2 号 ) 

[次 兴 其 兴 关 关 尖 六 尖 次 凑 关 关 关头 关 并 尖 闪闪 尖 关 六 尖 凑 尖 类 尖 关 尖 尖 凑 关 闪闪 关 关 


int taskl_main_ func (void x* para) 


semTake (semRingBuff ,WRIT_ROREVER) ; 
//WRIT_ROREVER 一 一 表示 该 任务 一 直 会 被 阻塞 ,直到 信号 量 可 以 获得 
// 当 调用 返回 时 ,任务 1 号 获得 访问 RingBuff 的 权利 
// eee 

SemGjive (SemRingBuff) ; 


在 互 斥 访问 的 过 程 中 ,semTake( ) 与 smGive( ) 总 是 在 每 一 处 成 对 出 现 。 先 Take, 然 后 
Give。 

同步 的 情形 恰好 与 之 相对 : 

信和 号 量 在 创建 时 被 初始 化 为 0(SEM_EMPTY) ,只 有 当 一 个 任务 准备 好 了 相应 的 资源 ,或 
达到 某 个 外 部 条 件 时 , 才 给 出 信号 量 ,使 得 该 信号 量 可 以 为 另 一 个 任务 所 拥有 ,从 而 继续 任务 
的 执行 。 

要 等 待 某 个 状态 或 中 间 结 果 的 任务 (或 线程 ) 通 过 调用 semTake() ,等 待 别 的 线程 发 出 就 
绪 通 知 ; 而 另 一 个 任务 (或 线程 ) 在 完成 某 种 预定 的 任务 之 后 ,设置 相应 的 状态 ,或 是 中 间 结 果 ， 
然后 通过 调用 semGive() ,向 等 待 任务 (或 线程 ) 发 出 通知 。 即 是 说 一 个 任务 给 出 信号 量 , 而 另 
一 个 任务 使 用 信和 号 量 。 

下 面 看 一 个 同步 的 例子 : 

// 兴 基 其 其 关 关 并 其 凑 凑 其 放 其 其 关头 凑 关 其 其 其 其 凑 关 关 其 关 


// 主任 务 


/1/ 兴 共 浴 关 关头 其 其 关 其 其 关 其 并 将 关头 其 关 关 其 其 其 关 凑 其 次 
SYNCBUFRE SYnCBuff; 
SEM_ID SenmSyncBuff; 


nt main_tasKk(…) 
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入 // 无 论 是 使 用 semTake, 还 是 SemGive, 信 号 量 在 使 用 之 前 必须 被 创建 
式 // 因 此 在 主任 务 中 ,首先 创建 它 

软 SemSYyncBuff = SemBCreate (SFEM_Q_PRIORITY， SFEM_EMPTY) ; 

人 和 

// 产 生 一 些 新 的 子 任务 ,例如 一 个 “产生 数据 者 ”(writer) 

计 taskID1 = taskSpawm (… ， task_writer_main,…); 

之 while(1) 

遇 

起 


[闪闪 闪闪 关 关 头头 关 兴 关 关 关 关 关 关 关头 关 关 关 关 其 关 关 关 关 次 


广 // 这 里 是 “ 读 取 数据 者 "(reader) 

法 // 例 如 一 个 播放 器 , 它 想 获得 一 些 原始 码 流 数据 
HA 关 兴 关 尖 关 关 其 其 关 关 其 关 尖 次 关 关 关 其 党 闪光 关 关 其 关 关 关 关 

62 SemTake〔〈SsemSyncBuff) ; 


// 访 问 同步 缓冲 区 (syncBuff) 中 的 数据 


WA[ 关 关 关头 尖 关 关 关 关 关 关 关 关 关 关 关 关 关 尖 关头 关 关 并 关 关 关 
// task writer〔〈 写 任务 ) 
WA 闪闪 关头 关头 关 关头 关 其 尖 关头 关头 关 关头 关 关 关 凑 关 关 关 关 
int task_writer_main (void x Para) 
《 
while(1) 
{ 
// 准 备 必 需 的 数据 ,例如 解码 视频 /或 音频 数据 帧 
// 或 者 以 一 个 外 部 设备 获取 数据 


// 现 在 当 数据 准备 好 之 后 ,通过 "“ 读 任务 ” 
// 同 步 缓 冲 区 的 数据 已 经 准备 好 ,可 以 被 使 用 
SemGive (SemSyncBuff) ; 


2. 多 值 信号 是 
多 值 信号 量 跟 二 值 信号 量 相似 ,只 不 过 它 跟 踪 并 记录 信号 量 给 出 的 次 数 ,所 以 它 常 用 来 管 
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理 像 缓 冲 队 列 那样 的 互 斥 访问 。 每 当 一 个 信号 量 给 出 (SemGive) 的 时 候 , 它 的 内 部 信号 量 计 
数 器 就 增加 1; 同 样 , 当 一 个 信号 量 被 获取 (SemTake) 时 , 它 的 内 部 信号 量 计 数 器 就 减 1 。 

除了 上 述 的 基本 操作 ,考虑 到 与 其 他 任务 的 同步 与 阻塞 : 当 一 个 信号 量 被 给 出 时 ,如 果 此 
时 试图 获得 该 信号 量 的 队列 有 等 待 的 任务 ,那么 这 个 时 候 需 要 唤醒 等 待 队 列 里 的 第 一 个 等 待 
任务 ,内 部 信号 量 计 数 器 因为 已 经 被 使 用 就 不 再 增加 ;如 果 没 有 任何 任务 处 于 等 待 状 态 , 即 该 
Semaphore 的 任务 等 待 队列 为 空 的 时 候 , 则 内 部 信和 号 量 计 数 器 就 加 1。 与 之 相对 , 当 一 个 信和 号 
量 被 试图 获取 时 ,如 果 信 号 量 的 计数 器 等 于 0, 获 取信 号 量 失败 , 则 内 核 需要 将 该 请 求 的 任务 
挂 在 一 个 信号 量 等 待 的 队列 里 ,一 旦 有 信和 号 量 给 出 时 , 排 在 等 待 队 列 里 的 第 一 个 任务 才 会 被 
唤醒 。 
2.5.4 人 临 噶 区 与 信号 量 的 实现 实例 

下 面 通过 一 个 实际 例子 来 说 明 如 何 实现 临界 区 与 信号 量 。 

这 个 例子 不 是 一 个 完整 的 实例 , 它 的 效率 也 很 低 , 但 它 的 确 可 以 实现 临界 区 和 信号 量 的 功 
能 。 这 个 例子 的 作用 是 破除 设计 者 对 “操作 系统 ”的 神秘 感 和 依赖 性 。 

程序 员 往 往 有 一 个 根深 带 固 的 概念 , 那 就 是 “操作 系统 ”该 做 的 事情 ,如 果 操 作 系统 没有 
做 , 则 自己 也 不 会 去 动 , 更 没 想 过 自己 能 够 去 动 它 。 其 实 操 作 系统 都 是 由 一 行 代码 加 一 行 代码 
组 成 ,都 是 由 人 设计 出 来 ,并 由 很 多 人 维护 的 ,我 们 同样 可 以 修改 和 维护 操作 系统 ,甚至 优化 它 
们 的 主体 结构 。 

1， 临界 区 

下 面 的 这 段 代码 是 用 ARM 汇编 写 的 进 人 和 退出 临界 区 的 代码 样 例 。 

;ENTRY “int enter_region(int addrsLock);，〈 函 数 原型 ) 


;return 0 - Success( 成 功 ) 
1- failed( 失 败 ) 


Eunction enter_region 


MOV 2,r0 
工 
LDREX r0,[r2] 
CMP r0, 间 0 
BEQ gf3 
MOV r0，, 井 0x1000 
CLREX 
2 
SUBS r0;r0，, 间 1 


HBNE 先 b2 
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B 先 bl 
3 
MOV z1， 间 1 
STREX r0,rli,[r2] 
5r0 一 返回 状态 ,rl - 存储 数值 
CLRREX 
5MOV ”， pcy, 1r 
Return 
EndFunc 


;ENTRY void leave_region(int addrLock); 〈 函 数 原 型 ) 


Function leave_region 


STRB rl, 井 0 
Return 
EndFunc 

进入 临界 区 的 函数 原型 是 : 


int enter_region(int addrsLock) ; 


第 一 个 参数 是 Lock 的 地 址 ,Lock 里 面 保存 着 它 的 值 ,如 果 Lock 的 原 值 非 0, 则 enter_re- 
gion 循环 等 待 。 直 到 Lock 的 值 为 0, 然 后 将 Lock 的 值 设 为 1。 

这 段 代码 使 用 了 总 线 互 斥 的 访问 来 保证 访问 的 一 致 性 。 其 中 LDREX,STREX 是 LDR 
和 STR 的 互 斥 访问 版 本 , 它 的 功能 跟 通 常 的 LDR,STR 基本 相同 ,只 不 过 是 这 两 条 指令 独 享 
总 线 在 读 / 写 操作 完成 之 前 ,不 会 被 中 断 , 从 而 保持 了 对 内 存 变 量 访问 的 原子 操作 。ARM 体 
系 使 用 了 另 一 条 指令 CLREX 来 解除 对 总 线 的 独 享 控制 。 如 下 所 示 : 


LDREX r0,[zr2] ; 独 享 总 线 , 从 r2 指示 的 内 存 读 取 数据 
CMP r0, 间 0 ;是否 等 于 0 

BEO 移 f3 ;是 ,跳出 等 待 

MOV r0， 井 0x1000 ; 否 ,继续 等 待 

CLREX ;取消 总 线 独占 


退出 临界 区 的 操作 比较 简单 ,而 且 不 需要 作 互 斥 操作 。 如 果 些 时 有 进入 临界 区 的 函数 试 
图 访问 这 个 变量 。 由 进入 临界 区 的 函数 独占 总 线 就 足够 了 。 因 为 ,修改 锁 的 操作 与 通常 的 内 
存 访 问 一 致 。 

2， 信 号 量 

下 面 的 函数 基于 上 面 的 临界 区 ,用 C 语 言 实现 一 个 完整 的 信号 量 协议 栈 , 它 可 以 与 Win- 
dows 的 信号 量 兼容 。 为 了 简化 设计 ,直接 在 内 存 里 划分 了 一 些 固守 区 域 来 存储 系统 变量 。 当 
然 , 如 果 所 在 的 系统 有 Memory 管理 的 话 ,用 Malloc 来 动态 分 配 或 分 配 在 固定 的 数据 段 区 域 
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也 是 一 样 的 。 使 用 绝对 地 址 的 目的 ,是 为 了 在 多 个 CPU 之 间 共享 使 用 内 存 变量 ,而 绕 过 了 虚 。 | 央 


拟 内 存 管 理 的 地 址 转换 带 来 的 麻烦 。 公 
为 了 保持 程序 的 完整 性 ,对 于 程序 里 所 要 使 用 的 字符 串 处 理 函 数 ,也 给 出 了 具体 的 实现 。 软 

这 些 函 数 通常 被 认为 是 “系统 程序 ”, 事 实 上 也 可 以 像 一 般 的 函数 那样 实现 它们 。 件 
下 面 是 semaphore. h 头 文件 的 定义 ， 人 
人 ， 

x ANfile semaphore.h 甩 

* \brief ”信号 量 实 例 代码 示例 头 文件 想 

x \ 一 MGN - 与 

x/ 亿 

法 


井 ifndef semaphore_h_ 
井 define “semaphore h_ 


A1] 65 
井 define SYS_DRT_BRSE 0x200000 

井 define LOCK_BRSE SYS_DRAT_BASE 

井 define LOCK_DLEN 16 

井 define ELOCK_NMRX 0x200 


井 define  SEM_BRSE AN 
(LOCK_BRSE + (LOCK_DELEN * LOCK_NMRX) ) 


井 define  SEM_DLEN 256 
# 井 define MRIRX_SEM_NRME_LEN 198 
井 define  SEM_NMRAX 0x100 


//(SEM_BRSE + (SEM_DLEN x SEM_NMRX) ) 


井 define INEINITE 9339333333 
井 define INVRALID_SEM 三 于 

井 define  SEM_TRKE_TIMEOUT 工 

井 define  SEM_SUCCESS 0 

井 define  SEM_WRIT _SLICE 0x8000 

井 define  SEM_HRNDLE int 


typedef struct  { 

int lock; 

int count 

Int maxcount; 

int usage; 

char name[MRX_SEM_NRME_LEN+ 2]; 
} SEMARPHORE; 


int “CreateSemaphore (void x* lpRttr,int init count,int max count,char x name); 
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int 0penSemaphore (int dwhcsess, int bInheritHandle,char x name); 
int “ClLoseSemaphore (int sem_id); 
int TakeSemaphore (int sem_id,int mn_wait); 


int GiveSemaphore (int sem_id) ; 


int _ enter_region( int addrLock ,int tnp,int val); 
void leave_region(int acidrLock, int val); 


static ，”__inline void LockSemaphore (SEMRPHORE x Psenm) 


{ 
enter_region((int)(S&psem- 盖 1ock),0,1); 
} 
static “inline void UnLockSemaphore 〈SEMRPHORE #* psem) 
{ 
leave_region((int)(&psem- 1ock),0); 
} 


井 endif //__semaphore_h_ 


以 下 是 实现 文件 semaphore. c: 


/ 1 闪闪 闪闪 其 其 其 关 关 兴 关 其 其 并 关头 凑 六 其 关 关 闪闪 闪闪 其 关 闪闪 其 话 关 关 其 其 尖 关 其 其 关 关 关 关 关 关 并 其 关 关 其 其 关 


x N\file Semaphore.C 

* \brief ”信号 量 实例 代码 示例 实现 文件 
# N\ = MGN = 

闪 / 


井 include "semaphore.h" 


/ 关 兴 并 关 关 关 兴 关 尖 凑 尖 关 其 凑 类 尖 关 关 关 并 尖 尖 尖 其 尖 关 尖 尖 关 关 其 尖 关 凑 尖 关头 关 并 关 关头 其 凑 尖 尖 关 尖 关 其 关 次 关 


* strncpy: 从 源 字符 串 复 制 至 多 n 个 字符 到 目的 缓冲 区 
x 结束 设置 NULL 终止 符 


其 
头 兴 关头 尖 关 关头 关 兴 其 关 兴 关 并 尖 凑 关 关 关 关 关 关头 凑 关 次 关 关 关 尖 尖 闪闪 凑 尖 关头 关头 尖 关 关头 关 其 关 关 尖 凑 关 关 关 / 
Char * Strncpy (char x* dst,char x* Scint n) 
{ 
char *d = dst; 
if (1dst || !src) return (dst); 
for (j; # SrC && ni d++ ,SrC++ mn 一 ) <d = 关 SICj 
while (n--) xd++ = 0 ; 
return (dst); 


} 


W/ 关 尖 关 凑 其 关 关 关 其 尖 关 其 关 闪闪 关 凑 其 关 关 关 关 关 其 关 关 关 关 其 关 尖 关 关 凑 关 关 关 关 关 关 关 关 关 关 其 凑 凑 其 关 其 关 并 其 
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* strlen: 返 回 指针 p 所 指向 的 字符 串 的 长 度 


其 
其 兴 兴 兴 关 关 尖 关头 类 尖 关 并 关 六 关 次 关 关 兴 关头 关 关 关 尖 其 关 凑 关 凑 关 关 关 其 关 关 关 关 关 其 尖 闪光 关 关 尖 关 其 关 关 其 关 / 
int strlen (char x P) 
{ 
int Dj 
iFE (1!P) Feturn (0)# 
for (CD = 0; xpBip++)》n++y 
return (n); 
》 


W/ 关 兴 关 尖 其 尖 关 闪 尖 尖 尖 尖 尖 关 关 关 关 尖 兴 关 兴 闪光 关 闪闪 关 尖 其 关 关 尖 尖 关 关 凑 凑 尖 济源 关头 关头 尖 关 尖 关 关头 关 黄 其 


# Strncmp: 与 strcnmp 类 似 , 但 是 至 多 比较 n 个 字符 
关 
兴 关 疼 关 兴 关 凑 关 尖 关 闪闪 尖 尖 关 关 关 尖 其 关 关 尖 兴 关 关 关 次 凑 尖 关 关 关 兴 关 次 关 关 关 凑 尖 关 凑 关 关 关 关 光 关 尖 产 关 关 尖 A 
int strncmp (char * S1,charx* S2,intD) 
{ 
if (1sl || !1s2) return (0); 


while (nS& (xsS1 == #xS2)) 
{ 
if(x*5s1 == 0) return (0) ; 
sS1++S2++3 
Dn 一 》 
} 
让 (n) return (xs1 一 x<S2); 
return (0) ; 


} 


static int IsValidSem(int sem_id) 
{ 
SEMRPHORR # psem = (SFEMRPHORE x* ) Sem_ids; 
Int ny 
if (sem_id << SEM_BRASE | | sem_id 之 (SEM_BASE + 
(SEM_DLRN x SEM_NMRX) )) 


return 0; 


mn = ((sem_jid 一 SEM_BASE) / SEM_DLEN) x* SEM_DLEN + SEM_BRSE; 
if (nn1 = sem_ id) 


Feturn 0; 


主 《(psem - 盖 maxcount 盖 0) 5&8 (Psem- 二 Usage 二 0)) 
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软 /闪闪 关 关 尖 关 关 关 关 关 其 关 次 尖 次 凑 尖 关 尖 关 其 关头 关 关头 关 尖 关 关 关 引 关 关 关 关 关 关 尖 关 关 关头 关 关 次 尖 关 关 关 关 次 关 
兴 InitializeSemaphore(); 

计 闪 初始 化 信号 量 基 本 数据 结构 。 这 个 函数 必须 在 使 用 信和 号 量 的 

之 尖 任何 例 程 之 前 被 调用 执行 ,一 个 系统 中 仅 需 被 调用 执行 一 次 

是 。 

想 x* 参数 :void 

与 闪 返回 :void 

万 兴 兴 闪闪 兴 关 关 关 其 尖 关 关 关 关 关头 关 兴 关 兴 关 凑 关 关 尖 尖 关 关 凑 尖 关 关 关 关头 关头 尖 凑 关 关 关 关 关 关 尖 关 其 尖 尖 关 关 关 / 


volid InitializeSemaphore (vold) 
{ 
68 int n， addr = SEM_BRSE; 
for (nD=0; n<CSEM_NMRX; n++) 
| 
SEMRPHORE * “Psem = (SEMRPHORE x )addr; 
Dsem 一 lock = 0; 
psem 一 盖 count = 0; 
Psem - 盖 usage = 0; 
psem - 过 maxcount = 0; 
psem - >name[0] = 0; 
addr += SEM_DLEN; 


} 


/ 兴 尖 关头 关 关 关 关 关 关 尖 关 关 关 关 关 关 关 关 关 关 尖 关 尖 次 关 闪闪 关 尖 尖 关 关 尖 兴 关 关 兴 关 尖 尖 关 关 关 其 关 凑 尖 关 其 凑 关 关 


类 CreateSemaphore(); 


创建 一 个 信号 量 

关 

兴 HRNDLE CreateSemaphore( 

闪 LPSECURITY_RATTRIBUTES 1pSemaphoreRttributes,// SD 
LONG 1InitialCount， // 信号 量 初始 数目 

兴 LONG 1MaximumCount， // 信号 量 最 大 数目 
尖 LPCTSTR 1pName // 信号 量 的 名 字 

基 ) 3; 

关 参数 和 

关 init_count -信号 量 初始 数目 


关 max_count -信号 量 最 大 数目 ，1 7 作为 起 始 , 所 以 它 必 须 比 0 大 
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X name -信号 量 的 名 字 撤 
x* 返回 代 
x 0 - 失败 ,不 能 为 这 个 信号 量 分 配 内 存 空间 软 
x non-0 -成 功 ,返回 的 句柄 (HRNDLE) 可 以 被 随后 的 调用 当 参 数 使 用 人 


兴 兴 关 关 类 关 关 关 关 闪闪 兴 关 尖 关 关 关 关 尖 关头 兴 头 基 关头 头头 关 关 次 基 关头 关 关 尖 兴 关 关 关 关 关头 关 关 尖 关 尖 关 其 其 关 A 人 
int CreateSemaphore (void x* JIpRttributes /* = NULL; omitted x / 这 
int init_count， 盏 
int max_count， // 信 和 号 量 最 大 数目 ,1 作为 起 始 想 
导 

廊 

法 


char x* name) 


int mn， addr = SEM_BRASE; 
for (Cn=0; n<CSEM_NMRX; mn++ ) 
{ 69 
SEMRPHORE * “psem = (SEMRPHORE x* )acdr; 
放 E (psem- 盖 maxcount == 0) 
{ 
psem 一 盖 ]lock = 0; 
psem 一 >>usage = 1 
psem 一 盖 count = init_counts; 
Psenm 一 盖 maxcount = max_count， 
psen- 记 name[0] = 0; 
证 (name) “ // 设 置信 号 量 的 名 字 
StrncpYy (psem - 盖 nameyname,MAX_SEM_NAME_LEN) ; 
return 〈addr); 
} 
addr += SEM_DLEN; 
}》 
return 0 //NULL 
) 
int CreateBSemnaphore (voidx lpyint icount,char x* name) 
{ 
return CreateSemaphore(1p, icount,2,name); 
}》 
A/ 关 关 闪闪 关 闫 关 尖 闪闪 关 关 关 关 其 尖 闪闪 尖 关 关 关 关 尖 关 关 尖 尖 关头 关 关 并 凑 关 凑 尖 关 头 关 头头 凑 并 关头 关 关 关 凑 关 关 次 
类 OpenSemaphore(); 
x 通过 匹配 名 字 ,打开 一 个 已 经 创建 的 信号 量 


关 


共 HRNDLE OpenSemaphore( 
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插 兴 DNORD dwDesiredaccess， // 存 取 属 性 

入 基 BO0OL bInheritHandle， // 继 存 选 项 

起 LPCTSTR 1PName // 对 象 名 字 

软 sx 

和 其 

计 闪 参数 ， 

多 name -用 以 匹配 的 信号 量 的 名 字 

棚 * 返回: 

与 关 0 -失败 

方 x non-0 -成 功 ,返回 的 句柄 (HRNDLE) 可 以 被 随后 使 用 

法 兴 关 兴 尖 关 关 兴 关 关 关 关 关 尖 关 关头 关 尖 尖 尖 关 尖 尖 尖 关头 深交 关 关 次 尖 凑 关 尖 关 关 关 尖 关 尖 其 尖 关 关 关 关 关 关 关 关 关 关 / 
int OpenSemaphore (int dwRhccess， /x* 忽 略 */ 

70 int 。”bInheritHandle， /忽略 关 / 


char x* mname) 


int ny lenyaddr = SEM_BRSE; 
for (n= 0; n<CSEM_NMRAX; n++ ) 
人 
SEMAPHORE * “psem = (SENMRPHORE x* )addr; 
证 (psem - 盖 maxcount 盖 0) 
{ 
len = Strlen (psem 一 name); 
if〔〈(1strncmp (nameypSsem 一 盖 name len) ) 
《 // 是 ,找到 匹配 的 
LockSemaphore (Psem) ; 
让 (psem- >>usage > 0)// 检查 这 个 信号 量 是 否 已 经 被 删除 
{ 
Psem 一 盖 Usage ++ 
UnLockSemaphore (psem); 
Teturn addr; 
} 
UnLockSemaphore 〈psem); 


} 
addr += SEM_DLEN; 
} 
return 0; ” // 没 有 找到 名 字 匹 配 的 信号 量 
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/ 关 兴 关 关 基 基 关 关 尖 尖 闪光 次 关 尖 尖 关 关 其 尖 关 并 关 类 凑 尖 关 关 关 类 关头 兴 尖 尖 类 尖 尖 并 兴 闪光 兴 尖 尖 尖 尖 关 尖 尖 次 关 六 氢 
类 CloseSemaphore() 入 
x 关闭 信号 量 ,但 它 不 一 定 实际 上 真正 删除 这 个 信号 量 起 
x 直到 它 的 引用 计数 减 为 0 时 , 才 真 正 删除 估 
。 参数， 设 
基 sem_id “一 信号 量 的 句柄 ,由 先前 创建 /或 打开 所 获得 区 
关 于 
X INVRLID_SEM 一 如 果 "sem_id" 指向 无 效 的 句柄 -与 
* SEM_SUCCESS -成 功 地 关闭 方 
兴 闪 党 关 关 尖 并 尖 尖 尖 关 尖 关 尖 次 尖 关 关 尖 关 关 尖 并 尖 并 光 尖 沈 关 尖 尖 凑 关 尖 关 关 关头 关头 关 关 关 闪光 关 关 关头 次 关 闪闪 法 


int CloseSemaphore (〈(;int sem_jid) 
{ 71 
SEMRAPHORE : Psem = (SEMRPHORE x* ) Sem_idyy 
证 〈! IsValidsen(sem_icD ) 
Freturn INVaALID_SEM; 


LockSemaphore (psem) ; // 必须 首先 加 锁 
Psem - 盖 Usage 一 - ; 
if (psem- usage<<= 0) 
{ 
psem 一 盖 cournt = 0; 
Psem - 盖 usage = 0; 
psem 一 盖 maxcount = 0; 
psem- >name[0] = 0; 
} 
//psem- >>lock = 0; 
UnLockSemaphore (psem) ; 
return 。SEM_SUCCESS; // 成 功 
} 


/ 闪 关 关 尖 其 关头 关 基 关 关 尖 关 其 尖 关 关 关 关 其 关 尖 关 尖 尖 尖 次 关 关 尖 关 关 关 关 并 关 关头 关 关 关头 其 关 关 其 关 闪闪 关 其 尖 关 


共 TakeSemaphore(); 


如 果 信 号 量 的 计数 大 于 0, 使 信号 量 的 计数 减 1 
(否则 进入 等 待 或 阻塞 ) 

美 参数: 

兴 sem_id -信号 量 的 句柄 ,由 先前 创建 /或 打开 所 获得 
n_wait “一 等 待 信号 量变 为 有 效 时 间 的 最 大 时 间 


"INEINITE” -一直 等 待 
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所 总 "OtherValue” 一 指定 等 待 的 循环 “时 间 ?” 
入 
工 关 返回 : 
软 四 INVRLID_SEM 一 如 果 "sem_id" 指向 无 效 的 句柄 
件 兴 SEM_TRKE_TIMEOUT 一 超时 
议 SEM_SUCCESS -成 功 获 得 信和 号 量 
中 闪闪 关 尖 关 兴 关 关 兴 关 尖 尖 关 兴 关 关 关 凑 尖 关 尖 尖 关 凑 关 关 凑 兴 关 关 关 关 关 关 关 关 关 关 关 兴 凑 活 关 闪闪 其 关 关 其 凑 只 关 关 / 
再 int TakeSemaphore (int sem_id,int Dn_wait) 
二 int 了 
方 . SEMRPHORE * “psem = (SEMRPHORE x* 》 sem_idyy 
法 if (1 IsValidSsen(sem_id)) 
return INVRLID_SEM; 
72 


while (n_wait != 0) 
{ 
LockSemaphore (psem) ; 
计 (psem- >>count 之 0){ 
psem 一 之 Count 一 一 ; 
UnLockSemaphore (psem) ; 
return ”SEM_SUCCESS; // 成 功 
} 
UnLockSemaphore (psem) ; 


if (n_wait 1 = INEINITE) 


Dn_wait 一 ; 
n = SEM_WRIT_SLICE; // 睡眠 一 小 段 时 间 
while (n) mn- 一 ; // 这 里 只 是 在 消磨 时 间 


} 
Teturn  SEM_TRAKE_TIMEOUT; 


/ 关 兴 闪 关 关 基 关头 其 关 关 其 关 关 尖 凑 尖 尖 次 尖 关头 关头 尖 凑 关头 关 关头 关头 六 闪闪 基 次 关 并 关 关 关 关头 关头 关 关 凑 基 关头 


关 GiveSemnaphore(); 


* 如 果 信 和 号 量 未 满 , 则 增加 信号 量 的 计数 

闪 (否则 不 执行 任何 操作 ) 

莽 参数 ， 

* sem_id “一 信号 量 的 句柄 ,由 先前 创建 /或 打开 所 获得 


关 返回 : 
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区 INVRLID_SEM - 如 果 "sem_id" 指向 无 效 的 句柄 
兴 SEM_SUCCESS - 成功 
二 从 厅 相 下 和 天 后 半 下 生生 荐 就 放 届 区 十 帮 基 引 本 玖 和 放 全 条 三 贡 和 
nt GiveSemaphore (int sem_id) 
{ 

SEMRAPHORE x Psemnm = (SEMAPHORE x* ) Sem_idy; 

if (! IsValidSem(sem_id) ) 

return INVRALID_SEM; 


LockSemaphore (Psem) ; 
if (psem- count < Psem - >faxcount) 
psem 一 盖 Count + 二; 
UnLockSemaphore (Psem) ; 
return  SEM_SUCCESS， // 成 功 
} 


// semaphore.c 文件 结束 


通过 使 用 命名 信号 量 , 可 以 在 多 个 进程 之 间 ,甚至 于 多 个 CPU 之 间 共 享 信号 量 。 虽 然 信 
号 量 协议 栈 看 似 复 杂 , 但 在 实现 的 简单 版 本 中 , 除 掉 注 释 和 大 括号 空格 行 以 及 字符 串 函 数 处 理 
函数 ,整个 协议 栈 仅 100 行 左右 C 程序 。 由 此 可 见 , 编 写 系 统 核心 程序 也 不 是 什么 神秘 的 
任务 。 

当然 这 个 实现 只 是 给 读者 显示 了 系统 函数 设计 的 一 个 简单 例子 ,在 一 些 时 候 , 如 果 系统 没 
有 提供 一 些 功能 ,例如 内 存 分 配 ,信号 量 , 这 时 可 以 通过 一 些 简 单 的 方式 来 实现 这 个 功能 ,使 得 
整个 系统 可 以 正确 运行 起 来 , 随 着 系统 的 设计 逐步 完善 和 复杂 化 ,再 把 相应 的 简单 功能 模块 逐 
步 完善 。 

这 个 信号 量 的 实现 中 没有 增加 阻塞 功能 ,只 是 采用 了 简单 的 等 时 控制 。 如 果 要 使 用 任务 
挂 起 机 制 ,情形 会 变 得 更 加 复杂 ,需要 增加 任务 队列 以 及 任务 调度 机 制 。 


| 


| 
和 
PN 一 人 


、 ie 
忆 和 过 ， 
党 盖 汪 
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前 面 两 章 讨论 了 程序 基础 ,以 及 与 通 人 式 开发 密切 相关 的 操作 系统 的 一 些 基 本 概念 ,它们 
是 嵌入 式 软件 设计 的 必 备 工具 和 理论 基础 。 舱 和 人 式 软 件 的 设计 对 象 就 是 硬件 ,包括 从 一 个 硬 
件 设备 或 一 个 硬件 功能 块 , 到 一 个 完整 的 硬件 平台 。 数 据 可 能 是 内 存 里 的 数据 对 象 ,也 可 能 是 
某 个 设备 端口 。 因 此 ,只 有 充分 理解 硬件 的 行为 ,才能 实现 对 硬件 的 有 效 控制 。 

具体 来 说 ,BSP 所 要 操作 的 对 象 是 整个 硬件 平台 , 它 包 括 对 整个 系统 资源 的 分 配 、 管 理 和 
控制 ;而 一 个 驱动 所 要 操作 的 是 一 个 硬件 设备 ,或 者 同类 型 的 硬件 设备 。 驱 动 有 时 也 不 一 定 与 
具体 设备 打交道 ,它们 可 能 为 具体 硬件 设备 的 操作 提供 服务 ,例如 文件 系统 的 驱动 。 还 有 的 硬 
件 是 为 其 他 硬件 设备 提供 数据 传输 和 控制 服务 的 ,这 些 硬件 就 是 后 面 要 介绍 的 总 线 ; 总 线 驱动 _ 
针对 总 线 设 备 所 设计 ,为 总 线 硬 件 设备 服 务 于 外 部 设备 提供 软件 支持 能 力 。 

组 成 一 个 硬件 平台 的 组 件 主要 有 中 央 控 制 器 的 CPU .连接 设备 的 总 线 、 各 种 输入 /输出 设 
备 .控制 传输 设备 和 数据 处 理 设备 ,等 等 。 

现行 的 SoC 典 和 人 式 设备 系统 都 是 基于 某 个 RISC 处 理 器 ,常见 的 处 理 器 有 MIPS,ARM， 
PowerPC ,它们 的 体系 架构 各 有 特色 ,在 程序 控制 方面 也 不 尽 相 同 。 本 章 的 硬件 基础 主要 介绍 
3 个 部 分 :ARM 处 理 器 ,MIPS 处 理 器 和 硬件 接口 基础 。 其 中 RISC 处 理 器 主要 介绍 CPU 的 
基本 架构 和 基本 编程 模式 ,然后 重点 介绍 与 艇 人 式 软件 BSP 设计 紧密 相关 的 异常 与 中 断 的 硬 
件 行为 及 其 软件 处 理 模 式 。 在 接口 基础 一 节 , 重 点 介绍 总 线 的 一 般 概念 与 作用 和 设备 的 概念 
模型 ,从 而 为 后 续 的 驱动 模型 打下 初步 基础 。 

本 章 的 介绍 只 是 以 点 带 面 , 作 一 些 人 门 性 的 介绍 。 读 者 可 以 循 着 这 条 线索 进一步 深入 


学 习 。 


3.1 ARM 


本 生生 站 操作 让 二 痢 半 于 表征 让 SENSE 六 村 二 生生 人 人 和 革 丰 和 和 0 寺 放 让 


ARM 处 理 器 广泛 用 于 各 种 便携 设备 以 及 各 种 机 械 . 电 子 智 能 设备 的 控制 中 。 常 见 的 例 
子 有 手机 ,GPS ,词典 ,监控 ,PDA,PS2,PMP 和 MP4, 等 等 。 

ARM 处 理 器 具有 较 强 的 运算 能 力 , 主 频 从 几 十 兆赫 效 到 1 吉 (G), 可 适用 于 各 种 实时 处 
理 、 实 时 操作 系统 、 图 形 界面 应 用 ,以 及 一 些 简单 档次 的 音频 .视频 软件 解码 和 播放 。 
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另外 ,ARM 处 理 器 还 具备 功 耗 低 的 特点 ,而 总 线 及 外 围 设 备 都 是 针对 低 功 耗 设计 的 ,从 “| 汇 
而 使 得 ARM 平台 广泛 应 用 于 各 种 便携 设备 中 。 人 
澡 

3.1.1 ARM 编程 模式 多 
1。 处理 器 模式 生 
ARM 共有 7 种 处 理 器 模式 ,在 每 种 模式 下 ,ARM CPU 都 有 各 自 独立 的 状态 寄存 器 ,并 | 之 

且 每 一 种 模式 都 有 几 个 独立 的 专 有 寄存 器 ,以 供 该 种 模式 下 的 私有 使 用 。 除 了 专 有 寄存 器 之 “| 四 


和 


外 ,有 一 部 分 寄存 器 是 ARM 在 每 一 种 模式 下 共用 的 。 
表 3-1 列 出 ARM 的 处 理 器 模式 以 及 寄存 器 分 组 。 方 
表 3-1 ARM 寄存 器 组 织 结构 


iT 


e | Ra_abt | RI13 nd | Ri3 
| RI4_abt | RI4und | Rl 


全 二 医生 [| | 古 芝 到 ce | ec | | -| 人 本 = 
和 
ARM 的 寄存 器 文件 中 共有 37 个 寄存 器 ,其 中 同一 时 刻 只 有 17 个 寄存 器 是 可 见 的 ,这 包 


括 16 个 通用 寄存 器 和 1 个 当前 程序 状态 寄存 器 。 对 于 16 个 通用 寄存 器 ,在 不 同 模式 下 ,分 别 
有 各 自 的 物理 实体 。 在 表 3 - 1 中 ,阴影 部 分 的 寄存 器 表示 那些 原来 在 用 户 模式 和 系统 模式 下 
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可 见 的 通用 寄存 器 ,在 特定 模式 下 被 专用 寄存 器 所 代替 。 这 些 专用 寄存 器 称 为 分 组 寄存 器 
(banked register) ,它们 只 有 当 ARM CPU 进入 到 特定 模式 下 才 有 效 。 

分 组 寄存 器 是 为 特定 模式 设置 的 ,用 于 在 进入 特定 的 异常 或 管理 等 特权 模式 下 作 特 殊 用 
途 使 用 。 

当前 程序 状态 寄存 器 CPRS 保存 了 指令 执行 的 条 件 码 .处 理 器 当前 的 模式 状态 及 其 控制 
信息 。 除 了 当前 程序 状态 寄存 器 之 外 ,还 有 在 异常 处 理 模 式 ( 共 4 种) 和 管理 模式 下 的 存储 状 
态 寄存 器 (SPRS) , 它 用 于 ARM CPU 进入 某 种 异常 模式 或 管理 模式 时 ,存储 进入 到 该 模式 前 
的 CPU 状态 ,以便 在 退出 这 些 特 权 模 式 时 ,恢复 到 先前 的 程序 状态 。 

值得 注意 的 是 ,由 表 3- 1 可 以 看 到 ,程序 计数 器 PC 和 CPRS 在 各 种 模式 下 都 使 用 了 相 
同 的 2 个 物理 寄存 器 , 即 是 说 程序 计数 器 对 于 全 局 是 唯一 的 。 同 样 ,CPRS 对 于 整个 ARM 也 
是 全 局 唯一 的 , 它 唯 一 决定 了 ARM 处 理 器 当前 的 模式 状态 .条 件 标志 、 中 断 许 可 等 系统 属性 ， 
详细 情况 可 参见 “程序 状态 寄存 器 ”部 分 。 

(1) 程序 计数 器 

16 个 通用 寄存 器 之 中 ,有 一 些 寄 存 器 被 用 于 专门 用 途 。 其 中 R15 被 用 做 程序 计数 器 PC 
(Program Counter) , 它 常 被 RO 到 R14 之 间 的 其 他 寄存 器 所 代替 , 因 些 PC(R15) 也 被 认为 是 
通用 寄存 器 之 一 。 如 上 所 述 ,R15 在 所 有 模式 下 都 共用 同一 物理 寄存 器 。 

(2) 连接 寄存 器 

R14 寄存 器 又 叫做 连接 寄存 器 , 它 有 两 个 作用 : 

@ 在 每 一 种 模式 下 ,Rl4 用 来 保存 子 程序 返回 的 地 址 。 当 一 个 函数 执行 BL 或 BLX 进行 
调用 操作 时 ,R14 被 设置 成 函数 返回 的 地 址 。 

@ 当 一 个 异常 产生 时 ,适当 的 异常 模式 下 所 对 应 的 Ri4 寄存 器 被 设置 成 从 该 异常 返回 的 
地 址 。 

除了 上 述 两 种 情况 之 外 ,R14 与 其 他 通用 寄存 器 相同 。 

(3) 栈 指针 

R13 通常 被 用 做 栈 指 针 , 从 而 也 常 叫 做 SP (Stack Pointer) 。 在 ARM 体系 架构 中 ,这 被 
作为 惯例 ,由 于 ARM 没有 特别 的 指令 需要 专门 使 用 R13, 所 以 人 R13 被 作为 通用 寄存 器 看 待 。 

每 一 种 异常 模式 都 有 其 专用 的 分 组 寄存 啥 作为 该 模式 下 的 栈 指针 ,它们 都 被 初始 化 为 该 
模式 下 栈 所 在 的 位 置 。 当 进入 异常 时 ,异常 处 理 程序 需要 在 该 栈 里 保存 所 使 用 的 寄存 器 ,以 免 
破坏 进 和 人 异常 时 寄存 器 中 的 原 值 。 处 理 完 毕 后 ,异常 处 理 程序 需要 将 那些 先前 保存 在 寄存 器 
中 的 值 重新 装载 到 原来 的 寄存 器 里 ,由 此 恢复 进入 异常 之 前 的 现场 。 异 常 处 理 程序 通过 这 种 
机 制 来 保护 程序 的 运行 状态 ,从 而 使 程序 状态 不 会 在 异常 处 理 的 过 程 中 被 破坏 。 


2. 当前 程序 状态 寄存 器 
CPSR, 即 当前 程序 状态 寄存 器 , 它 可 以 在 各 种 模式 下 被 访问 。 在 当前 程序 状态 寄存 器 中 
保存 了 指令 执行 的 条 件 码 和 处 理 器 当前 的 模式 状态 以 及 控制 信息 。 每 一 种 异常 模式 还 对 应 一 
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个 存储 程序 状态 寄存 器 (SPSR) ,用 于 当 异 常 发 生 时 保存 CPSR 的 值 。 
CPSR 和 SPSR 寄存 器 的 格式 如 图 3 -1 所 示 。 
31 30 29 28 27 26 8 7 654 3 ”1 0 
N|zjclylaq DNMGBAD7 | FT wws|vzjMlwo| 


图 3-1 ARM 程序 状态 寄存 器 格式 


(1) 条 件 码 

图 3-1 中 的 N,Z,C,V,Q 位 是 条 件 码 ,其 中 : 

国 N 一 Negative, 表 示 如 果 上 条 影响 条 件 码 的 指令 执行 结果 为 负 时 。 

莉 Z 一 Zero, 表 示 如 果 上 条 影响 条 件 码 的 指令 执行 结果 为 零 时 。 

国 C 一 分 下 列 4 种 情形 讨论 。 

@ 对 于 加 法 (包括 条 件 比 较 指 令 CMN) ,如 果 加 法 产生 一 个 进位 , 则 C 标志 置 位 ,否则 
为 0。 

@ 对 于 减法 (包括 条 件 比较 指令 CMP) ,如 果 减 法 产生 一 个 借 位 , 则 C 标志 清除 , 置 0, 和 否 
则 为 1。 

@@ 对 于 非 加 减 的 移 位 操作 ,C 被 设置 成 被 移 位 器 移出 的 最 后 那 一 位 。 

昌 对 于 其 他 的 非 加 减 操 作 ,C 一 般 不 会 改变 。 

量 V 一 Overflow ,溢出 标志 。 

二 Q 一 用 于 指示 DSP 操作 的 溢出 。 

(2) 控制 码 

图 3-1 中 的 IF,T 位 是 控制 码 。 其 中 ， 

国 I 一 控制 中 断 是 否 被 允许 。 

玫 上 一 控制 快速 中 断 是 否 被 允许 。 

对 于 ARM 体系 4 及 以 上 结构 , 工 标志 有 以 下 含义 : 

图 为 0 指示 ARM 指令 执行 。 

于 为 1 指示 Thumb 指令 执行 。 

在 ARM 状态 及 Thumb 状态 之 间 进 行 切换 的 指令 可 以 在 这 些 CPU 架构 上 实现 ,但 是 仅 
仅 当 程序 运行 在 ARM 状态 下 才能 正常 工作 。 如 果 一 个 程序 在 Thumb 状态 下 想 要 切 回 ARM 
状态 , 则 在 切换 之 后 的 第 一 条 指令 处 将 导致 一 个 Und 异常 。 在 进入 到 Und 异常 后 ,异常 处 理 
程序 可 通过 SPSR_und 的 “T” 标 志 来 检测 异常 产生 的 根源 是 否 来 源 于 试图 进行 状态 切换 , 若 
是 ,ARM CPU 则 有 机 会 在 Thumb 状态 下 切换 到 ARM 状态 。 

(3) 模式 位 

利用 程序 状态 寄存 器 的 M4,M3,M2,M]1,M90 位 的 各 种 组 合 可 以 确定 CPU 的 工作 模式 。 
如 表 3-2 所 列 。 
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表 3-2 ARM 状态 寄存 器 的 模式 位 


中 断 模式 PC,R14_irq,R13_irq,R12~ 一 R0,CPSR,SPSR_irq 


0b11011 未 定义 模式 PC,R14_und R13_und,R12 一 R0,CPSR ,SPSR_und 


不 是 所 有 的 组 合 都 定义 了 有 效 的 模式 ,如 果 未 定义 的 组 合 被 编程 到 CPSR 状态 寄存 器 中 ， 
则 CPU 的 状态 会 发 生 不 可 预测 的 情况 。 


3.1.2 ARM 指令 概述 


跟 于 篇 幅 , 本 书 不 介绍 ARM 指令 及 汇编 程序 的 语法 。 关 于 ARM 编程 的 书籍 有 很 多 ,这 
里 根据 笔者 的 经 验 提 出 一 些 编程 中 的 注意 之 点 ,在 本 节 的 最 后 ,通过 一 个 具体 的 例子 来 说 明 汇 
编 编 程 的 一 些 常用 伪 指 令 。 

1， 条 件 执行 

ARM 汇编 的 一 个 显著 特点 是 在 指令 中 增加 了 条 件 码 。 一 条 语句 是 否 被 执行 , 它 依赖 于 
处 理 器 当前 的 状态 ,以 及 在 指令 中 所 指定 的 条 件 。 

条 件 执行 减少 了 分 支 指令 的 数目 ,相应 地 减少 了 指令 流水 线 的 排 空 次 数 ,从 而 发 送 了 执行 
代码 的 性 能 。 条 件 执行 主要 依赖 于 两 部 分 :条 件 码 和 条 件 标志 。 条 件 码 位 于 指令 中 ,条 件 标志 
位 于 cpsr 中 。 

条 件 标志 是 处 理 器 执行 前 一 条 指令 ,或 若干 条 指令 之 前 的 某 一 条 指令 时 产生 的 结果 状态 
标志 。ARM 指令 中 有 一 部 分 指令 是 一 定 会 影响 到 结果 标志 的 ,但 有 些 指令 却 不 改变 结果 标 
志 。 对 于 同一 功能 的 指令 ,往往 也 有 对 应 的 改变 或 不 改变 结果 标志 的 一 对 指令 。 

2. 栈 的 使 用 

ARM 指令 中 没有 包括 栈 操作 的 指令 , 即 是 说 ,没有 像 x86 那样 有 入 栈 或 出 栈 的 指令 。 对 
于 栈 的 操作 需要 使 用 通用 指令 来 手动 维护 。 

使 用 LDM 与 STM 可 以 维护 栈 , 根 据 栈 的 生长 顺序 ,以 及 栈 基地 址 的 改变 先后 ,一 共有 4 
种 可 能 的 栈 操 作 方 式 。 8 


” 加 (Eull Descending 一 满 。 向 下 生长 ) 


PC,R14~Ro,CPSRCARM 体系 4 及 以 上 ) 
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ED 〈Empty Descending 一 空 。 向 下 生长 ) 悉 

FR (Full Mscending 一 满 。 向 上 生长 ) 

ER (Empty Ascending 一 空 。 间 上 生长 ) 也 

其 中 Full 表示 栈 指针 指向 栈 顶 元 素 , 即 最 后 一 个 人 栈 的 元 素 。Empty 则 指向 与 栈 顶 元 素 件 
邻近 的 ,下 一 个 可 用 元 素 的 空位 置 。 设 

Ascending 表示 数据 栈 向 内 存 地 址 增加 的 方向 生长 。Descending 则 表示 数据 栈 向 内 存 地 “| 计 
址 减少 的 方向 生长 。 思 

3. 参数 的 传递 臣 

少 于 4 个 整数 的 参数 通过 RO~-R3 来 传递 ,其 他 的 通过 数据 栈 来 传递 。 广 

子 程序 的 返回 结果 为 一 个 32 位 整数 时 通过 寄存 器 R0 返回 。 如 果 结果 是 64 位 整数 时 ， | 法 
则 通过 Ro 和 R1 返回 。 

这 里 只 列举 了 简单 的 情况 ,完整 的 参数 传递 情况 参见 详细 的 ARM 编程 手册 。 79 


4，ARM 汇编 例子 
下 面 通 过 一 个 简单 的 例子 说 明 ARM 汇编 程序 的 结构 。 这 个 例子 显示 了 一 个 简单 的 初始 
化 启动 函数 ,代码 中 的 中 文 注 释 详细 解释 了 所 遇 到 的 各 条 指令 以 及 伪 代 码 的 意义 。 


RRER |_my_tst_1| ,CODE ;标识 一 个 段 的 开始 ,此 处 是 代码 (CODE) 段 


PRESERVE8 

INCLUDE stdmacros.s ;通过 INCLUDE 包含 头 文件 

INCLUDE SVS_SVYsStem. S 

IMPORT “mpt_mainl ;从 一 个 外 部 模块 引用 一 个 符号 
;类 似 于 extern 

EXPORT ”mp2_mainl ;输出 一 个 本 文件 定义 的 函数 符号 

EXPORT ” enter_region ;同上 ,输出 一 个 外 部 可 以 调用 枉 数 的 符号 
;相当 于 全 局 函数 

ENTRY ;模块 的 开始 

Eunction ”mp2_mainl 函数 的 名 字 


;分 号 开始 的 一 行 的 后 半 部 分 为 注释 


;创建 一 个 小 的 临时 栈 ,使 用 内 存 中 位 于 2 位 置 区 域 
;设置 了 栈 之 后 ,就 可 以 调用 一 些 简 单 的 C 函数 了 


LDR sp，= 0x200000 
MOV zl, 井 0x10000 ;立即 数 赋 给 通用 寄存 器 zl 


工 ;等 待 一 个 小 的 时 间 段 
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SUBS rl,rl, 间 1 
BNE 秽 bl 
SEV iSetEvent 设置 事件 ,通知 其 他 CPU 
BL mpt_malnl 
1 
B % bl ;如果 出 错 , 死 锁 在 这 里 
EndFunc ;标识 一 个 函数 的 结束 
;ENTRY :int enter_region(int addrLock);( 函 数 原型 ) 
返回 0- 成功 
; 1 一 失败 
Function enter_region ; 范 数 名 字 即 一 个 函数 的 开始 
MOV rl,I0 ;项 数 可 以 带 参数 ,第 一 个 参数 由 r0 传递 
1 
LDREX r0,[zrl] 3 互 斥 地 装载 一 个 存储 变量 到 寄存 器 
CMP r0，, 提 0 ;比较 ,是 否 等 于 0 
BEQ 币 3 iYES, 转 到 后 面 的 标号 3 
MOV r0, 井 0x1000 ;NO, 置 0 = 0x1000, 进 入 下 面 的 循环 等 待 
CLREX ;清除 总 线 互 斥 访问 
2 
SUBS r0,r0, 井 1 ;循环 等 待 一 个 时 间 段 
BNE 多 b2 
也 先 bl 
3 
STREX r0,r2,[Lrlj] 5I0 状态 ,r2 存储 的 值 
CLRREX 
;MOV pc，1r :通过 将 lzr 赋值 给 pc 来 从 一 个 函数 返回 
Return 
EndFunc 5 标识 一 个 函数 的 结束 
END ;标识 上 面 定 义 的 一 个 代码 段 的 结束 
;下 面 3 行程 序 定义 一 个 新 的 段 (数据 段 ) 
*RRER 标识 一 个 新 的 段 
及 RER | SECOND $ $ data| ,DRTR,READWRITE 


5 定义 数据 变量 
Sec_awake_ino DCD SEC_RNRKE_INO 
END ;标识 一 个 数据 段 的 结束 


3.1.3 ARM 异常 及 处 理 
异常 来 源 于 CPU 内 部 或 外 部 的 源 ,它们 人 迫使 处 理 器 转 而 去 处 理 一 些 特殊 的 事件 ,例如 一 
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个 外 部 硬件 设备 所 产生 的 一 个 中 断 , 或 企图 执行 一 条 未 定义 的 指令 。 程 序 在 转 和 人 到 异常 之 前 “| 娩 
的 状态 必须 正确 保护 ,以 便 先前 运行 的 程序 在 异常 处 理 完毕 时 可 以 重新 开始 。 在 同一 个 时 刻 ， | 公 
可 以 允许 多 于 一 个 的 中 断 和 异常 同时 发 生 。 

ARM 支持 ?7 种 类 型 的 异常 。 表 3 - 3 列 出 了 这 些 异 常 的 类 型 ,以 及 处 理 器 处 理 这 些 异 常 “| 件 
时 所 进入 的 模式 。 当 红 常 产生 时 ,ARM CPU 强制 程序 从 固定 的 内 存 点 开始 执行 。 这 些 固定 | 到 


的 地 址 被 称 之 为 异常 向 量 (exception vectors) 。 
表 3-3 ARM 异常 处 理 的 入 口 地 址 是 

本 有 

人 

异常 类 型 处 理 器 模式 一 般 中 断 向 量 地 址 高 端 向 量 地址 -二 

复位 管理 模式 仿 

0x00000000 0xFFFF0000 法 

Reset (Supervisor) 和 

81 


当 一 种 异常 产生 的 时 候 , 异 常 模式 的 分 组 寄存 器 R14 以 及 程序 状态 寄存 器 用 来 保存 现场 
状态 ,其 通用 形式 如 下 ， 
R14_ 一 异常 模式 > = return link 


SPSR_ 一 异常 模式 > = CPSR 
CPSR[4 : 0] = 异常 模式 


CPSR[5] = 0 /x 执行 于 ARM 状态 * / 
IF 忆 异 常 模式 这 == Reset 或 FIQ THEN 
CPSRL6] = 1 /* 禁止 快速 中 断 * / 
/* else CPSRL6] 不 改变 * / 
CPSR[7] = 1 /#* 禁止 普通 中 断 * / 
PC = 异常 矢量 地 址 /x 迫使 处 理 器 从 固定 的 异常 向 量 处 开始 执行 * / 


如 果 需 要 从 异常 处 理 中 退出 来 , 则 SPSR 中 的 存储 内 容 需 要 被 移 到 CPSR 寄存 器 中 ,而 
R14 寄存 器 中 的 值 需要 移 到 PC 中 ,以 实现 先前 运行 程序 的 返回 。 

这 可 以 通过 以 下 两 种 方式 自动 实现 ， 

@ 使 用 数据 处 理 的 指令 ,使 S 位 置 位 ,并 且 使 PC 作为 目标 寄存 器 。 

@ 使 用 Load Multiple 并 且 恢 复 CPSR 状态 的 指令 ,例如 LDM(3) 。 
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1. 复位 异常 
当 复 位 产生 时 ,ARM CPU 马上 停止 现 有 程序 的 执行 ,然后 转 和 人 如 下 准备 及 执行 过 程 ， 


R14_svc = 未 知 不 确定 值 
SPSR_svc = 未 知 不 确定 值 


CPSR[4 : 0] = 0bl0011 /x* 进 入 管理 模式 * / 
CPSR [5] = 0 /* 在 RMRM 状 态 下 运行 */ 
CPSRL6] = 1 /#* 禁 止 快速 中 断 * / 
CPSR[7] = 1 /xx 禁止 普通 中 断 * / 


IF 忆 高 端 矢量 被 配置 之 THEN 
EC = 0xFFEFF0000 

ELSE 
PC = 0x00000000 


在 复位 之 后 ,ARM CPU 从 地 址 0x00000000 或 0xFFFF0000 处 开始 执行 ,ARM 处 理 器 
进入 到 管理 模式 ,并 且 复 位 之 后 ,CPU 总 是 处 于 ARM 状态 ,而 非 Thumb 状态 。 快 速 中 新 和 
一 般 普 通 中 断 都 被 禁止 。 


注意 :复位 没有 返回 ,所 以 人 14 以 及 SPSR_svc 的 值 都 是 不 确定 的 ,也 是 不 需要 的 。 处 理 
程序 不 能 试图 依赖 R14 寄存 器 的 值 执行 返回 。 


2. 未 定义 指令 异常 

如 果 ARM 执行 一 条 协 处 理 器 指令 , 它 将 等 待 外 部 的 协 处 理 器 响应 ,以 确定 是 否 可 以 执行 
那 条 指令 。 如 果 没 有 任何 协 处 理 器 响应 , 则 产生 未 定义 指令 异常 。 

如 果 程 序 尝 试 执行 一 条 CPU 不 支持 的 指令 ,例如 一 个 二 进 制 库 里 可 能 编译 了 为 高 端 
CPU 所 运行 的 指令 ,这 个 时 候 也 产生 未 定义 指令 异常 。 ， 

如 果 一 个 系统 里 没有 特定 的 一 个 硬件 协 处 理 器 ,未 定义 指令 异常 可 以 用 来 对 协 处 理 器 作 
软件 模拟 。 未 定义 指令 异常 还 可 以 用 来 通过 软件 模拟 来 对 指令 集 作 扩展 。 

当 未 定义 指令 异常 产生 时 ,ARM CPU 马上 停止 现 有 程序 的 执行 ,然后 转 人 如 下 准备 及 热 
行 过 程 ， 

R14_svc = 产生 异常 指令 的 紧 接 一 条 指令 的 地 址 

SPSR_svc = CPSR 


CPSR[4 : 0] = 0bll1011 /< 进入 未 定义 模式 */ 
CPSR [5] = 0 /xx 在 RRM 状 态 下 运行 */ 
/* CPSRL6] 不 改变 * / 

CPSR[7] = 1 /* 禁 止 普通 中 断 * / 

IF < 高 端 撩 量 被 配置 之 THEN 


BC = 0xFFFF0004 


ELSE 


PC = 0x00000004 入 

为 了 从 未 定义 指令 异常 中 返回 ,可 以 执行 如 下 指令 ， 本 
MOVS “PC,R14 件 

， 了 芭 

这 导致 从 R14_und 中 恢复 PC 的 值 ,以 及 从 SPSR_und 恢复 CPSR 的 值 , 并 且 返 回 到 发 生 计 
异常 的 那 条 指令 随后 的 一 条 指令 所 在 的 地 址 开始 执行 。 之 
3. 软件 中 断 异 党 必 
软件 中 断 迫 使 CPU 进入 到 管理 模式 (supervisor) ,以 请 求 操作 系统 执行 特殊 的 管理 功能 。: 


通常 是 用 户 程序 执行 系统 调用 进入 到 内 核 模式 ,需要 请 求 操作 系统 内 核 执行 某 些 特殊 的 操作 。 | 法 
当 软 件 中 断 异 常 发 生 时 ,CPU 执行 如 下 操作 


R14_svc = 软件 中 断 的 下 一 条 指令 的 地 址 83 
SPSR_Ssvc = CPSR 

CPSR[4 : 0] = 0bl0011 /* 进 入 管理 模式 * / 

CPSR [5] = 0 /* 在 BaRNM 状 态 下 运行 */ 

/x* CPSRL6] 不 改变 * / 

CPSR[7] = 1 /x<* 禁 止 普通 中 断 * / 


IE 评 高 端 矢 量 被 配置 之 THEN 
PC = 0xFFFFE0008 

ELSE 
PC = 0x00000008 


为 了 从 软件 中 断 指令 异常 中 返回 ,可 以 执行 如 下 指令 ; 
MOVS PC,R14 


这 导致 从 R14_svc 中 恢复 PC 的 值 , 以 及 从 SPSR_svc 恢复 CPSR 的 值 ,并且 返 回 到 发 生 
软件 中 断 指 令 异 常 的 随后 的 一 条 指令 所 在 的 地 址 开始 执行 。 

4. 指令 预 取 中 止 异 常 

指令 预 取 中 止 异 常 是 指 CPU 从 内 存 中 读 取 指 令 时 产生 的 异常 。 指 令 预 取 中 止 异 常 由 存 
储 系 统 产生 。 激 发 一 个 指令 预 取 异常 是 CPU 在 试图 执行 一 条 无 效 的 指令 时 产生 的 。 如 果 一 
条 指令 没有 被 执行 ,例如 在 执行 了 一 个 跳 转 而 预先 读 取 的 指令 未 被 执行 , 则 不 会 产生 指令 预 取 
异常 。 在 ARM v5 及 以 上 的 版 本 ,指令 异常 还 可 以 由 执行 BKPT 指令 时 产生 。 当 CPU 试图 
执行 一 条 产生 中 止 的 指令 时 ,CPU 将 发 生 下 列 行为 : 

R14_svc = 被 中 止 的 指令 的 地 址 + 4 


SPSR_svc = CPSR 
CPSR[4 : 0] = 0bl0111 /*<* 进 入 中 籼 模式 */ 
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氢 CBSR [5] = 0 /x* 在 BRM 状 态 下 运行 */ 

7 /* CPSR[6] 不 改变 * / 

式 CPSR[7] = 1 /* 禁 止 普通 中 断 * / 

软 IF 二 高端 矢量 被 配置 之 THEN 

件 PC = 0xFFEFR000C 

设 ELSE 

计 PC = 0x0000000C 

是 当 修复 产 生 指 令 中 止 的 原因 之 后 ,从 指令 预 取 异常 返回 时 执行 如 下 类 似 的 指令 ， 

SUBS PC,R14, 间 4 

这 条 指令 将 从 R14_abt 中 恢复 PC 的 值 ,以 及 从 SPSR_abt 恢复 CPSR 的 值 ,并 且 返 回 到 


发 生 指令 预 取 中 止 的 那 条 指令 并 重新 执行 。 
84 5. 数据 中 止 异 常 
数据 中 止 异 常 是 指数 据 存 取 内 存 时 产生 的 异常 。 数 据 中 止 异 常 是 由 存储 系统 产生 。 激 发 
一 个 数据 异常 是 由 于 在 数据 存 取 ( 读 或 写 ) 的 时 候 这 个 数据 无 效 而 产生 。 数 据 中 止 异常 先 于 随 
后 的 指令 或 异常 ,在 更 改 CPU 的 状态 之 前 而 产生 ,然后 转 和 人 如 下 准备 及 执行 过 程 ， 


R14_svc = 产生 异常 指令 的 地 址 + 8 
SPSR_Ssvc = CPSR 


CPSR[4 : 0] = 0bloll1 /< 进入 中 止 模式 * / 
CPSR [5] = 0 /xx 在 RAR 状态 下 运行 */ 
/x* CPSR[6] 不 改变 * / 

CPSR[L7] = 1 /xx 禁止 普通 中 断 * / 


IF < 高 端 撩 量 被 配置 这 THEN 
PC = 0xFEFFKF0010 

FELSE 
PC = 0x00000010 


当 修复 产生 数据 中 止 的 原因 之 后 ,从 数据 中 止 返回 时 执行 如 下 类 似 的 指令 ; 
SUBS PC,R14, 井 8 
这 条 指令 将 从 Rl4_abt 中 恢复 PC 的 值 ,以 及 从 SPSR_abt 恢复 CPSR 的 值 ,并 且 返 回 到 


发 生 数据 中 止 的 那 条 指令 并 重新 执行 。 
如 果 产 生 数 据 异 常 的 指令 不 需要 再 次 执行 , 则 执行 如 下 类 似 的 指令 


SUBS EC,R14, 间 4 


6. 中 断 异常 
中 断 (IRQ) 蜡 常 的 产生 是 由 于 处 理 器 的 中 断 输 入 线 得 到 外 部 硬件 中 断 的 请 求 。 中 断 异 常 
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的 优先 权 比 快速 中 断 的 优先 级 要 和 低 ,因而 当 一 个 快速 中 断 序列 进入 时 ,普通 的 中 断 异 常 就 被 屏 “| 据 
蔽 掉 。 人 

中 其 可 以 由 CPSR 程序 状态 寄存 器 的 I 一 标志 位 所 屏蔽 。 如 果 I 一 标志 位 被 清除 , 则 人 
ARM CPU 会 在 一 条 指令 的 边界 检测 是 否 有 外 部 中 断 请 求 的 输入 。 人 


当中 断 产生 时 ,CPU 执行 下 列 操作 序列 ， 
R14_irq = 将 要 执行 的 下 一 指令 地 址 + 4 之 
SPSR_irq = CPSR 甩 
CPSR[4 : 0] = 0b10010 /* 进入 中 断 模式 * / 想 
CPSR [5] = 0 /* 在 RRM 状态 下 运行 * / 机 
/cpSRL6] 不 改变 */ 蔷 
CPSR[7] = 1 /* 禁 止 普通 中 断 * / 

IE 玫 高 端 矢量 被 配置 之 THEN 


PC = 0xEFFF0018 
了 LSBR 
PC = 0x00000018 


中 断 服务 处 理 结束 需要 返回 时 ,执行 如 下 类 似 的 指令 : 
SUBS PC,R14, 提 4 


这 条 指令 将 从 R14_irq 中 恢复 PC 的 值 ,以 及 从 SPSR_irq 恢复 CPSR 的 值 , 并 且 重 新 执 
行 被 中 断 的 指令 。 

7. 快速 中 断 异常 

快速 中 断 (FIQ) 蜡 常 的 产生 是 由 于 处 理 器 的 快速 中 断 输入 线 得 到 外 部 硬件 中 断 的 请 求 。 
FIQ 的 设计 是 为 了 支持 数据 的 传输 或 通道 的 处 理 , 由 于 快速 中 断 有 足够 多 的 私有 寄存 器 ,从 而 
减少 了 对 寄存 器 保存 与 恢复 的 时 间 , 从 而 减少 了 中 断 服务 时 作 上 下 文 切 换 所 引起 的 系统 开销 。 

快速 中 断 可 以 由 CPSR 程序 状态 寄存 器 的 一 标志 位 所 屏 藤 。 如 果 下 一 标志 位 被 清除 ， 
则 ARM CPU 会 在 一 条 指令 的 边界 检测 是 否 有 外 部 快速 中 断 请 求 的 输入 。 

当 快 速 中 断 产生 时 ,CPU 执行 下 列 操作 序列 ; 


R14_fiq = 将 要 执行 的 下 一 指令 地 址 +4 
SPSR_fiq = CPSR 


CPSR[L4 : 0] = 0bl10001 /x* 进入 快速 中 断 模式 * / 
CPSR[5] = 0 /x* 在 RRNM 状 态 下 运行 */ 
CPSR[6] = 1 /* 禁 止 快速 中 断 * / 
CPSR[7] = 1 /* 禁 止 普通 中 断 * / 


IF 必 高 端 矢 量 被 配置 之 THEN 
PC = 0xFFFF001C 
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ELSE 
PC = 0x0000001C 
快速 中 断 服务 处 理 结束 需要 返回 时 ,执行 如 下 类 似 的 指令 ， 


SUBS BC,R14，, 间 4 


这 条 指令 将 从 R14_ fiq 中 恢复 PC 的 值 , 以 及 从 SPSR_ fiq 恢复 CPSR 的 值 , 并 且 重 新 
执行 被 中 断 的 指令 。 

特别 地 ,FIQ 的 中 断 矢量 被 特别 设计 成 ARM 中 断 向 量 表 中 的 最 后 一 个 中 断 , 从 而 允许 快 
速 中 断 服务 例 程 直 接 存放 在 系统 的 异常 向 量 表 之 后 ,减少 从 快速 中 断 矢 量 跳 转 到 FIQ 处 理 服 
务 例 程 所 引 的 时 间 开 销 。 

8， 异常 的 优先 级 

表 3-4 列 出 了 ARM 体系 中 异常 的 优先 级 。 

甫 3-4 ARM 异常 的 优先 级 


优先 级 异常 类 型 
高 1 复位 (Reset) 


未 定义 指令 异常 (Undefined instruction) ,软件 中 断 (SWD 


3.2 MIPS 


CN 


地 


MIPS 是 典型 的 RISC 架构 , 具有 规整 的 指令 集 、 指 令 预 取 以 及 多 级 流水 线 结构 。MIPS 
是 作为 RISC 学 习 的 主要 教材 典范 ,所 以 它 具 有 许多 RISC 的 优点 。 

MIPS 有 大 的 寄存 器 文件 , 极 大 地 减少 了 外 部 存储 的 使 用 。 

MIPS 的 CPU 中 断 数目 也 比较 多 ,最 多 可 以 扩展 到 16 级 ,从 而 减少 了 小 型 系统 对 外 部 扩 
展 中 断 控 制 器 需求 ,并 且 增加 了 中 断 响应 的 速度 。 

除了 通用 的 MMU 之 外 , MIPS 还 支持 简单 的 MMU ,从 而 简化 了 敌人 和 式 系统 软件 的 设 
计 。 特 别 地 ,通过 使 用 简单 MMU ,简化 了 系统 初始 引导 加 载 过 程 中 地 址 映射 转换 的 手续 ,使 
得 Boot-loader 以 及 固件 程序 的 设计 变 得 简单 .容易 。 
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3.2.1 MIPS 编程 模式 


1. 协 处 理 器 

MIPS 体系 定义 了 4 个 协 处 理 器 :CP0,CP1,CP2 和 CP3。 

其 中 ,CP0 集成 在 CPU 片上 ,以 支持 虚拟 内 存 管理 以 及 异常 的 处 理 。CP0 寄存 器 又 称 为 
系统 控制 协 处 理 器 。 

2。 CPU 寄存 器 

MIPS 体系 定义 了 如 下 的 CPU 寄存 器 : 

国 32 个 32 位 通用 寄存 器 。 

四 一 对 特殊 用 途 寄 存 器 (HI,LO) ,它们 用 于 保存 整数 乘法 ,除法 , 乘 加 运算 的 结果 。 

国 一 个 特殊 用 途 的 程序 计数 器 (PC) 。 

MIPS CPU 通用 寄存 器 中 ,R0 硬件 编码 为 0, 读 出 永远 是 0, 写 人 任意 的 值 ,其 结果 都 保持 
为 0。 

R31 被 用 作 连 接 寄 存 器 。 如 果 下 述 指令 中 没有 在 代码 语句 中 特别 指明 目标 寄存 器 , 则 
R31 被 自动 用 作 目 标 寄 存 器 : 

JAL,BLTZAL,BLTZALL,BGEZAL,and BGEZALL 

除 此 之 外 ,R31 的 使 用 与 通用 寄存 器 一 样 。 

在 乘法 操作 时 ,HI 和 LO 寄存 器 用 于 联合 起 来 存储 乘积 的 结果 ,两 个 32 位 整数 相 乘 产生 
64 位 乘积 ,其 中 高 32 位 存放 在 HI 寄存 器 中 , 低 32 位 存放 在 LO 寄存 器 中 。 

在 乘 累加 、 乘 累 减 操作 时 , 乘 的 结果 与 HI 和 LO 联合 起 来 组 成 的 64 位 数 相 加 或 相 减 ,最 
终 的 结果 再 次 更 新 于 HI 和 LO 寄存 器 对 中 。 同 样 , 高 32 位 存放 在 HI 寄存 器 中 , 低 32 位 存 
放 在 LO 寄存 器 中 。 

对 于 除法 操作 ,32 位 整数 除 以 32 位 整数 , 除 得 的 商 存 于 LO 寄存 器 中 ,余数 放 于 HI 寄存 
器 中 。 

图 3 -2 显示 了 MIPS32 的 CPU 寄存 器 。 

3.FPU 寄存 器 

MIPS 体系 定义 了 如 下 浮 点 处 理 单元 (FPU) 寄 存 器 : 

国 32 个 浮 点 寄存 器 :所 有 的 32 个 浮 点 寄存 器 都 可 用 于 存储 单 精度 浮 点 操作 数 。 对 于 双 

精度 浮 点 操作 数 , 可 用 一 个 奇偶 对 浮 点 寄存 器 来 存储 。 

国 5 个 FPU 控制 寄存 器 用 于 标识 和 控制 浮 点 处 理 单元 。 

图 3-3 显示 了 MIPS 的 FPU 寄存 器 。 

4， 系统 控制 寄存 器 

表 3-5 列 出 了 MIPS 系统 控制 寄存 器 CP0 ,其 中 列 SEL 表示 在 同一 个 寄存 器 名 字 下 选择 


KR 的 
党 


jd 
全 


rm 
E 


各 
型 


1 
性 


六 
六 


Co 
六 
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杞 | 的 不 同 内 部 索引 。 


31 0 
L _  _ PE 
特殊 用 途 寄存 器 


3-2 MIPS CPU 寄存 器 


表 3-S$ MIPS 系统 控制 寄存 器 CP0 


寄存 器 名 字 


坷 存 器 序号 
索引 TLB 阵列 


8 

一 Ti 

TI 

TEN 

国王 TITITTTZITETSTTT 
人 | 
E 
[| 


和 


?7 
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续 表 3-5 


寄存 器 序号 SEL 寄存 器 名 字 


EntryHi TLB 条 目的 高 阶 部 分 
Seems 


11 


天 | 王 一 
co | 心 党 


四 
本 =] 
《 


功 能 
了 


16 


人 


3 


4 
On 


一 
< 


了 


2 


保留 


与 SoC 实现 相关 
Debug EJTAG 调试 寄存 器 


o 
kS 


二 | 二 | 二 | 一 二 | 一 
慷 | 安 co | | c cn | 心 


ko Fo CS 
2 CD 


29 Cache 一 标签 接口 的 高 价 部 分 
SS 
| 和 | 9。 jpmorpPc | 最 后 由 铺 的 程 友 计数 各 CI | 
as 


fS 
Km 


CS 


Mo5 
< 
局 


已 | 吕 
和 | 中 

钙 
员 


if 
oo 


外 
起 ] 
习 
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特殊 用 途 寄 存 器 


3-3 MIPS FPU 寄 存 器 


3.2.2 MIPS 指令 概述 


根据 功能 ,MIPS CPU 指令 可 以 分 为 如 下 几 大 类 ， 

量 装 人 ,存储 ; 

二 计算 ; 

可 跳 转 ; 

时 其 他 杂 处 理 ; 

嘲 协 处 理 器 操作 。 

每 一 条 指令 都 是 32 位 长 度 。 

1， CPU 装 入 存储 操作 指令 

MIPS CPU 使 用 装 人 /存储 结构 。 所 有 的 运算 操作 都 是 基于 寄存 器 中 的 操作 数 , 主 存 的 
存 取 操 作 仅 通 过 装 入 和 存储 操作 指令 。 
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人 
iv | 
> 


MIPS 有 各 种 各 样 的 存 人 和 存储 操作 指令 ,每 一 种 指令 都 用 于 不 同 的 目的 。 
国 传输 不 同 长 度 的 数据 单元 ,如 LB,SW。 
国 对 于 所 传输 的 数据 , 当 作 有 符号 的 或 无 符号 的 ,如 LHU。 
国 存 取 未 对 齐 数 据 单元 ,如 LWR,SWL。 件 
鳃 原子 的 内 存 更 新 ( 读 一 修改 一 写 ) ,如 LL/SC。 设 
无 论 MIPS 是 高 字 节 顺 序 ,还 是 低 字 节 顺 序 , 字 节 、 半 字 或 字 的 地 址 都 是 它们 所 占据 存储 这 
单元 的 中 字 节 地 址 最 低 的 地 址 。 从 而 : 征 
量 对 于 高 字 节 顺序 ”这 意味 着 半 字 或 字 的 地 址 是 最 高 有 效 字 节 的 地 址 。 想 
国 对 于 低 字 节 顺 序 这 意味 着 半 字 或 字 的 地 址 是 最 低 有 效 字 节 的 地 址 。 衣 
(1) 装 入 存储 的 存 取 类 型 注 
表 3 -6 列 出 各 种 MIPS 架构 所 支持 的 装 人 和 存储 数据 单元 宽度 的 类 型 
表 3-6 MIPS32/MJIPS64 装 入 /存储 指令 所 支持 的 数据 类 型 91 


CPU 协 处 理 器 1 和 2 


未 对 齐 的 学 MIJIPS32 MIPS32 
(Unaligned word) 

连接 的 字 MIPS32 MIPS32 
(Atomic modify) 


(2) CPU 装 入 存储 指令 
表 3-7 和 表 3-8 列 出 了 CPU 的 装 入 存储 指令 。 
表 3-7 MIPS 对 齐 的 装 入 存储 指令 表 3-8 MIPS 非 对 齐 的 装 入 存储 指令 
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MIPS CPU 支持 非 对 齐 的 字 的 存储 与 装 和 人 。 一 般 的 字 的 边界 需要 4 字 节 对 齐 , 但 有 时 数 
据 存 放 的 起 始 地 址 可 能 不 是 4 的 整数 倍 ,例如 在 一 些 数据 结构 的 定义 中 。 那 么 这 个 时 候 对 于 
这 个 字 ( 比 如 一 个 32 位 的 整数 ?的 读 取 或 存储 ,就 不 能 使 用 LW 或 SW 的 指令 来 操作 ,否则 就 
会 产生 地 址 异常 。 

如 果 使 用 非 对 齐 的 字 节 存 取 就 可 以 解决 这 个 问题 。 但 是 对 于 非 对 齐 的 字 的 存 取 需 要 使 用 
一 对 特殊 的 指令 , 即 两 条 指令 来 存 取 一 个 字 。 表 3 - 8 中 所 列举 的 读 指令 用 于 读 取 靠 左边 或 靠 
右边 的 字 节 到 一 个 寄存 器 ,两 次 读 的 组 合 就 可 以 读 一 个 完整 的 字 ( 其 起 始 地 址 不 是 4 的 整数 边 
界 ), 写 也 一 样 。 

(3) 用 于 原子 操作 的 装 入 存储 指令 

用 于 原子 操作 的 装 人 存储 指令 如 表 3 - 9 所 列 。 

装 人 连接 字 (LL) 条 件 存储 字 (SC) 等 两 条 指令 可 用 于 实现 原子 操作 的 “ 读 一 修改 一 写 ” 的 
操作 原 语 ,其 中 原子 变量 可 以 位 于 被 缓存 的 主 存 区 域 。 这 些 指 令 需 要 用 于 细心 设计 的 序列 ,以 
提供 操作 系统 所 需 的 多 种 同步 与 互 斥 原 语 ,包括 “Test 一 and 一 Set”, 位 域 级 别 的 锁 、 信 和 号 量 以 
及 事件 计数 器 等 。 

(4) 协 处 理 器 操作 的 装 入 存储 指令 

表 3-10 列 出 的 是 协 处 理 器 操作 的 装 人 存储 指令 。 

表 3 -9 MIPS 原子 更 新 的 装 入 存储 指令 表 3-10 协 处 理 器 装 入 存储 指令 


ET 一 
| LU | 著 和 连接 的 字 (Load Linked Word) | Lpcz | 装 入 双 字 到 协 处 理 器 一 z， z 一 1, 或 2 
| SC | 条 件 地 存储 字 (Store Conditional Word) | ”ELwcz 。 | 装 入 字 到 协 处 理 器 一 z， z=1, 或 2 


SDCz 存储 双 字 到 协 处 理 器 一 z，z 一 1, 或 2 
| swcz | 存储 字 到 协 处 理 器 一 zx, z=1, 或 2 


如 果 某 个 协理 器 不 被 支持 ,对 协 处 理 器 的 操作 则 将 导致 协 处 理 器 不 可 使 用 的 异常 。 

2. 算术 操作 指令 

〈1) 与 立即 数 或 三 操作 数 相关 的 算术 逻辑 指令 

表 3-11 列 出 了 一 个 操作 数 是 寄存 器 , 另 一 个 操作 数 是 立即 数 的 算术 逻辑 指令 。16 位 立 
即 数 在 指令 编码 字 中 指定 。 

表 3-11 MIPS 立即 数 操作 的 算术 指令 表 3-12 MIPS 三 操作 数 算术 指令 


| App | 16 位 无 符号 立即 数 扩展 | 。。 | ADDU | 操作 数 为 无 符号 数 ,操作 数位 宽 为 字 的 加 法 
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续 表 3 -11 续 表 3- 12 报 

助 记 符 指令 意义 个 

| AND “| 操作 数 为 字 的 按 位 “与 "操作 软 

1U | 远 16 位 立即 数 装 入 到 一 个 32 位 寄存 器 的 NOR “| 操作 数 取 反 操作 件 
.了 

高 位 OR “| 操作 数 为 字 的 按 位 “或 操作 设 

计 

| ”oORI 。 广 个 寄存 器 字 与 16 位 立即 数 扩展 相 “ 或 " | SLT “| 如 果 源 操作 数 小 于 目标 操作 数 , 则 填 位 
ee 

| SLTI | 如 果 小 于 16 位 立即 数 , 则 置 位 SLTU 如 果 作 为 无 符号 数 , 源 操作 数 小 于 目标 操作 好 
| SLTIO | 徊 时 小 于 16 位 无 符号 立即 数 , 则 全 位 和 人 想 
SUB | 操作 数 为 字 的 减法 局 

| xORI | 个 寄存 器 字 与 16 位 立即 数 扩展 相 * 异 或” 二 
操作 数 为 无 符号 数 ,操作 数位 宽 为 字 的 减法 1 


| XOR “| 操作 数 为 字 的 按 位 * 异 或 "操作 


(2) 二 操作 数 算术 逻辑 指令 
表 3-13 列 出 了 二 操作 数 算术 指令 。 
(3) 移 位 指令 
MIPS 移 位 指令 有 两 种 形式 的 指令 ， 
图 移 位 的 位 数 包 含 在 指令 码 中 的 5 位 立即 数 
国 移 位 的 位 数 包含 在 一 个 通用 寄存 器 中 的 低 5 位 数值 
表 3-13 MIPS 二 操作 数 算术 指令 表 3-14 MIPS 移 位 指令 


| cLO | 计 数 一 个 字 的 前 导 1 的 个 数 | SLL 。 | 逮 辑 左 移 一 个 字 , 移 位 位 孝 包 含 在 立即 数 (指令 ) 中 
SRA 
SRL 


[ 
OR 


| 。 SRA | 算术 左 移 一 个 字 , 移 位 位 数 包含 在 立即 数 (指令 ) 中 
| ”SRAV | 算术 左 移 , 移 位 的 位 数 包 含 在 一 个 通用 寄存 器 中 


| 。 SRL | 于 辑 右 移 一 个 字 , 移 位 位 数 包含 在 立即 数 (指令 ) 中 
| ”SRLY ”| 光 辑 右 移 , 移 位 的 位 数 包含 在 一 个 通用 寄存 器 中 


| 


〈4) 乘除 指令 

跟 其 他 处 理 器 一 样 ,乘法 与 除法 会 产生 两 倍 的 数据 结果 。 乘 除 将 其 结果 存放 于 HI 和 LO 
寄存 器 中 ,有 一 个 例外 :MUL 指令 将 结果 的 低 半 部 分 直接 放 在 通用 寄存 器 中 。 

Mnultiply 产生 完整 宽度 的 乘 结果 , 它 是 输入 数据 位 宽 的 2 倍 , 即 64 位 。 其 中 低位 的 32 位 
结果 存放 于 LO 寄存 器 , 较 高 的 32 位 结果 存放 于 HI 寄存 器 。 

Multiply-ADD,Mnujltiply-Subtract 产生 完整 宽度 的 乘 结果 , 它 是 输入 数据 位 宽 的 2 倍 , 即 
64 位 ;并 且 与 HI,LO 寄存 器 组 合 形成 的 64 位 操作 数 相 加 ,或 相 减 ,其 结果 的 低 半 部 分 存放 于 
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氢 } LO 寄存 器 , 较 高 的 32 位 结果 存放 于 HI 寄存 器 。 


入 Divide 产生 的 商 放 于 LO 寄存 器 中 ,余数 放 于 HI 寄存 器 中 。 
图 表 3-15 MIPS 乘除 法 指令 

设 

主 位 宽 为 字 的 除法 

之 位 宽 为 字 的 无 符号 数 除法 

写 位 宽 为 字 的 乘 加 操作 

与 位 宽 为 字 的 无 符号 数 的 乘 加 操作 

2 从 HI 寄存 器 移出 数据 


冯 从 LO 寄存 器 移出 数据 
位 宽 为 字 的 乘 减 操作 
位 宽 为 字 的 无 符号 数 的 乘 减 操作 
移 进 数据 到 HI 寄存 器 


位 宽 为 字 的 乘法 操作 
位 宽 为 字 的 无 符号 数 的 乘法 操作 


3.， 跳 转 及 分 支 指令 

转移 指令 包括 跳 转 (Jump) 及 分 支 (Branch) 指 令 。 

〈1) 转移 的 类 型 

MIPS 体系 定义 了 以 下 几 种 类 型 的 转移 : 

罩 PC -相对 的 条 件 分 支 转移 。 

重 PC -所 在 区 域 的 无 条 件 跳 转 。 

国 绝对 地 址 的 (依赖 于 寄存 器 ?的 无 条 件 跳 转 。 

国 用 于 过 程 调用 ,其 返回 地 址 被 记录 在 一 个 通用 寄存 器 (R31) 中 。 

〈2) 延迟 梭 

所 有 的 转移 指令 ,都 有 一 条 指令 时 间 的 延迟 执行 。 在 转移 指令 之 后 紧 接 的 指令 在 跳 转 到 
新 的 指令 位 置 之 前 会 被 执行 。 转 移 指令 之 后 的 位 置 被 称 之 为 Branch Delay Slot 。 

为 了 保持 异常 或 中 断 不 影响 Delay Slot, 跳 转 必须 是 可 以 重信 的 。 从 而 异常 或 中 断 处 理 
例 程 必须 重新 执行 跳 转 的 指令 。 

针对 Delay Slot,MIPS 体系 定义 了 两 种 类 型 的 转移 : 

国 Branch 类 Delay Slot 处 的 指令 总 是 被 执行 。: 


国 Branch-Likely 类 ”如果 转 移 未 成 功 , 则 Delay Slot 处 的 指令 不 会 被 执行 。 拼 


(3) 跳 转 指令 列表 入 
跳 转 指 令 列 表 如 表 3 - 16 和 表 3 - 17 所 列 。 
大 

表 3-16 MIPS 256M 区 域内 无 条 件 跳 转 指令 件 

人 

和 

大 二 诡 本 ET 

上 好 

vi 

起 

依赖 于 寄存 器 的 跳 转 二 

跳 转 并 连接 交换 方 

跳 转 法 


表 3-17 MIPS PC 相对 的 条 件 转 移 指 令 


大 于 0 时 转移 ,并 且 连 接 
小 于 或 等 于 0 时 转移 
BGEZ 大 于 或 等 于 0 时 转移 小 于 0 时 转移 
BGEZAL | 大 于 或 等 于 0 时 转移 ,并 且 连 接 BLTZAL | 小 于 0 时 转移 ,并 且 连 接 
BGTZ “| 大 于 0 时 转移 


3.2.3 MIPS 中 断 与 异常 


1. 中 断 
MIPS 处 理 器 支持 8 个 中 断 请 求 , 可 以 分 成 4 类 : 
国 软件 中 断 有 2 个 中 断 请 求 可 通过 软件 设置 Cause 寄存 器 的 IP0 位 或 IP1 位 。 
国 硬件 中 断 CPU 总 共 支 持 6 个 硬件 中 断 请 求 输入 ,这 些 中 断 依 赖 于 外 部 硬件 的 具体 
实现 。 
国 时 钟 中 断 ” 当 计数 器 与 比较 寄存 器 的 值 相 同时 ,就 会 产生 时 钟 中 断 。 
国 效率 计数 器 中 断 ” 当 计数 器 的 最 高 位 为 1, 且 效率 计数 控制 寄存 器 的 下 位 被 设置 为 允 
许 时 ,产生 效率 计数 中 断 。 
时 钟 中 断 、 效 率 计 数 器 中 断 以 及 硬件 中 断 5 共享 同一 个 中 断 输入 线 , 它们 依赖 于 具体 的 
Soc 实现 来 决定 最 终 的 硬件 行为 。 
当前 的 中 断 请 求 可 以 通过 查询 Cause 寄存 器 中 的 耳 标志 位 来 确认 ,它们 之 间 的 映射 关系 
如 表 3 -18 所 列 。 
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表 3-18 MIPS 的 中 断 、 状 态 及 缘由 寄存 器 的 映射 关系 


呈 = 
中 断 类 型 中 断 号 

8 IPO 8 0 

JIP2 10 2 

12 4 

13 5 

14 6 

15 冰 


名 
IM 
IM 
IM 
IM 
IM 
IM 
本 到 权 光 
由 表 3 - 18 中 可 以 看 出 ,对 于 缘由 (cause) 寄 存 器 中 的 每 一 位 ,在 状态 (status) 寄 存 器 中 都 
有 一 位 与 之 对 应 ,从 而 所 有 8 组 中 断 都 可 以 按 位 屏蔽 或 允许 。 一 个 中 断 仅 当下 面条 件 都 为 真 
时 才 会 被 允许 ， 
二 一 个 中 断 的 请 求 位 在 缘由 (cause) 寄 存 器 中 的 IP 字段 是 1; 
国 在 状态 寄存 器 中 相对 应 的 屏蔽 位 是 1 
图 状态 寄存 器 的 IE 位 是 1; 
国 调试 (debug) 寄 存 器 的 DM 位 是 0; 
国 状态 寄存 器 的 EXL 和 ERL 位 是 1。 
逻辑 上 的 操作 是 ,缘由 寄存 器 的 下 字段 与 状态 寄存 器 的 IM 字段 按 位 “与 ?, 其 8 位 结果 
相 "“ 或 ”后 再 与 中 断 允 许 位 (IE) 相 “与 ”。 最 终 , 中 断 请 求 , 当 且 仅 当 状 态 寄存 器 的 EXL 和 ERL 
位 是 0, 以 及 调试 寄存 器 的 DM 位 是 0 时 才 会 被 真正 产生 传 给 CPU ,并 得 到 响应 。 后 面 的 3 个 
条 件 分 别 对 应 于 非 异 常 处 理 模式 、 非 错误 处 理 模式 和 非 CPU 调试 模式 。 
2. 异 常 
当 一 个 异常 产生 时 ,通常 的 指令 执行 顺序 被 中 断 。 产 生 这 些 异 常 的 事件 可 能 是 执行 一 条 
指令 所 产生 的 副作用 ,例如 执行 一 条 指令 时 导致 其 结果 溢出 了 整数 的 边界 ,或 者 一 条 装 人 数据 
的 指令 导致 TLB 未 命中 ;异常 事件 或 许 不 是 由 指令 执行 而 直接 引起 的 ,例如 一 个 外 部 中 断 。 
当 一 个 异常 产生 时 ,CPU 停止 运行 当前 的 指令 ,保持 足够 的 处 理 器 状态 ,以 备 被 中 断 的 指令 序 
列 的 执行 可 以 重新 开始 。 然 后 CPU 转 人 到 内 核 模式 ,开始 执行 软件 的 异常 处 理 例 程 。 被 保 
存 的 状态 以 及 异常 处 理 程 序 的 地 址 ,依赖 于 异常 的 类 型 以 及 当前 CPU 的 状态 。 下 面 作 进 一 
步 讨论 。 


硬件 中 断 5 号 ,时 钟 中 断 
或 效率 计数 器 中 断 
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(D) 异常 向 本 
复位 (reseb 向量 地 址 ,软件 复位 (soft - reset) 向 量 地 址 以 及 非 屏蔽 中 断 异 党 的 向 量 地 址 “| 入 
总 是 在 0xBFCO -0000 处 。EJTAG 调试 的 异常 向 量 位 于 0xBFCO -0480 或 0xFF20 0200 | 让 


处 ,分 别 取 决 于 EJTAG 控制 寄存 器 (EJTAG_Control_Register) 的 ProbEz 位 为 0 或 为 1。 件 
表 3 - 19 给 出 了 异常 向 量 依赖 于 Status. [BEV] 标 志 位 的 不 同 配置 值 所 对 应 的 基地 址 。 | 设 

表 3 - 20 给 出 了 各 个 具体 异常 相对 于 这 些 基地 址 的 地 址 偏 移 。 号 
表 3-19 MIPS 异常 向 量 的 基地 址 地 


Status. [BEV] -人 


法 


Reset，Soft - Reset，NMI 0xBFC00000 


EJTAG - Debug(EJTAG 控制 寄存 器 . [ProbEzj=0) 0xBFC00480 
EJTAG - Debug(EJTAG 控制 寄存 器 .[ProbEz] 王 1) 0xFF200200 


Cache 错 0xA0000000 0xBFC00200 


0x80000000 0xBFC00200 


表 3-20 MPSs 异常 向 量 的 偏 移 地 址 


异 党 向 量 地 址 偏 移 异 常 向 量 地 址 偏 移 
TLB 重 填充 ，EXL=0 0x000 中 断 ,Cause. [LIV] = 1 0x200 


恨 eset, Soft - Reset, NMI 0x000 


(2) 异常 处 理 的 一 般 过 程 
复位 、 软 件 复位 以 及 非 屏蔽 中 断 等 异常 ,它们 有 各 自 特 别 的 处 理 方式 , 除 此 之 外 ,其 他 异常 
前 遵循 下 面 的 基本 流程 : 
国 如 果 Status 寄存 器 的 EXL 位 是 0,EPC 寄存 器 装载 发 生 异 常 时 程序 计数 器 (PC) 的 值 ， 
Cause 寄存 器 的 BD 标志 被 适当 置 位 以 标识 是 否 为 转移 延迟 。 
图 如 果 Status 寄存 器 的 EXL 位 是 1,EPC 寄存 器 不 装 人 被 异常 中 止 的 程序 计数 器 的 值 ， 
Cause 寄存 器 的 BD 标志 也 不 被 更 改 。 
加 Cause 寄存 器 的 CE, 以 及 上 xcCode 字段 被 装 和 人 与 异常 相关 的 值 。 
于 Status 寄存 器 的 EXL 被 置 1。 
是 处 理 器 从 异常 向 量 处 开始 执行 。 
EPC 寄存 器 里 装载 的 值 代表 异常 处 理 完毕 之 后 需要 重新 开始 执行 的 地 址 ,因而 一 般 情 况 
下 ,异常 处 理 程序 不 能 修改 EPC 的 值 。 软 件 不 必 查 看 BD 的 值 , 除 非 软 件 希望 准确 知道 导致 
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异常 时 指令 所 在 的 实际 地 址 。 
发 生 异 常 时 ,CPU 内 部 的 一 般 处 理 流程 如 下 : 


IF (Status.[EXL] = 0) 
IF (指令 位 于 转移 指令 延迟 槽 ) THEN 
EPC =“PC 重 新 开始 的 地 址 ” 井 EC of branch/junp 
Cause.[BD] = 1 
ELSE 
EPC =“PC 重 新 开始 的 地 址 ” 二 PC of instruction 
Cause.[BD] = 0 
ENDIF 
IF 〈 异 常 类 型 = TLB- 重 填充 ) THEN 
Vector - 0ffset = 0x000 
ELSE IF( 异 常 类 型 = 中 断 》 and (Cause.[IV] = 1) THEN 
Vector - Offset = 0x200 
ELSR 
Vector - 0ffset = 0x180 
ENDIJIF 
ELSE 
Vector - 0ffset = 0x180 
ENDIEF 
Cause.[CE] =“ 错 误 协 处 理 器 的 号 数 ” 
Cause,[ExcCode] =“ 异 常 类 型 ” 
Status, [EXL] = 1 
IE (Status.[BEV] = 1) THEN 
PC<-0xBEC00000 + Vector - Offset 
ELSE 
PC<-0x80000000 + Vector - 0ffset 
ENDIE 
ENDIE 


3.3 接口 基础 


和 相生 二村 生 S 生 和 相生 村 全 车 全 下 符 人生 让 人 仙 于 抽 让 二 计生 


在 微机 体系 与 艇 人 式 硬件 体系 中 ,各 种 各 样 的 外 部 设备 都 通过 不 同 的 总 线 与 CPU 相连 ， 
并 进行 相互 间 的 通信 与 数据 交互 。 设 备 与 设备 之 间 的 相互 通信 与 数据 交互 也 通过 总 线 相连 。 
一 组 总 线 包 括 数据 线 和 控制 线 。 数 据 线 是 用 来 在 设备 与 设备 之 间 、 设 备 与 CPU 之 间 传 递 数 
据 , 而 控制 线 是 用 来 监察 和 控制 相互 之 间 的 状态 是 否 就 绪 、 是 否 结束 ,以 及 建立 和 维护 数据 传 
输 的 所 有 控制 信号 。 
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简 而 言 之 ,总 线 为 连接 在 总 线 上 的 硬件 设备 提供 数据 通路 和 控制 信号 。 设 备 通过 总 线 与 
总 线 上 的 其 他 设备 (包括 CPU) 交 换 数 据 , 或 是 通过 总 线 接受 总 线 控制 器 发 出 的 指令 ,以 及 设 
备 通过 总 线 向 总 线 控制 器 发 出 状态 报告 、 人 因此 ,总 线 是 设备 之 间 ( 包 
括 CPU) 传 输 数 据 的 桥梁 。 


3.3.1 总 线 概述 


现代 微机 系统 以 及 嵌 人 式 设备 系统 中 ,包含 种 类 繁多 的 总 线 。 下 面 是 一 些 例子 : 

里 微机 系统 里 早期 使 用 的 ISA, EISA 总 线 , 后 期 发 展 起 来 的 PCI,AGP,USB 和 1394 

国 用 于 在 芯片 之 间 进 行 相互 通信 的 了 下 C。 

量 存储 设备 的 总 线 ,例如 连接 硬盘 与 光驱 的 ATA,ATAPI,SCSI, 连 接 CF 卡 的 与 IDE 兼 

容 的 总 线 ,连接 SD 卡 及 MCI 卡 的 SD Memory 总 线 以 及 SDIO 总 线 。 

国 汽车 电子 上 广泛 使 用 的 CAN 总 线 。 

嚼 ARM 公司 定义 的 .广泛 用 于 便携 媒体 上 的 AMBA 高 级 总 线 。 

入 除 此 之 外 ,还 有 很 多 连接 音频 、 视 频 输 入 /输出 信号 的 各 种 总 线 。 

因此 ,总线 无 处 不 存在 ,只 要 2 个 设备 间 需 要 稳定 .可 靠 地 交互 数据 ,就 存在 一 个 协议 标 
准 , 以 控制 设备 之 间 的 数据 传输 ,就 需要 借助 现 有 的 总 线 标准 或 是 创建 一 种 新 的 总 线 标准 。 

所 谓 的 总 线 ,是 在 CPU 与 设备 ,或 设备 与 设备 之 间 物 理 上 的 电气 连接 线 ,一 组 总 线 包 括 
地 址 线 .数据 线 和 控制 线 。 地 址 线 常常 是 8 位 .16 位 .32 位 ,取决 于 设备 内 部 的 寻 址 能 力 ; 数 据 
线 的 宽度 可 以 是 I 位 .4 位 .8 位 16 位 32 位, 它 取决 于 设备 的 数据 传输 的 吞吐 能 力 ;控制 线 一 
般 包 括 时 钟 . 读 . 写 和 选中 ,以 及 其 他 总 线 传输 的 开始 .终止 和 等 待 所 需要 的 控制 线 . 电 源 以 及 
接地 线 。 

由 此 看 来 ,一 组 完整 的 总 线 需要 许多 物理 连接 线 。 一 般 来 说 ,地 址 线 越 宽 ,数据 线 越 宽 , 控 
制 线 复 用 越 少 ,操作 起 来 就 越 便捷 ,传输 速率 也 会 越 高 。 但 是 受 电气 特性 和 空间 布局 的 影响 ， 
一 般 要 求 传 输 连 接线 越 少 , 臣 离 越 短 ,物理 实现 越 容易 。 因 此 ,实际 的 总 线 需 要 在 这 二 者 之 间 
折衷 选取 ,尽量 减少 连接 线 。 例 如 著名 的 下 C 就 只 有 2 根 信号 线 ,1 根 时 钟 ,1 根 数据 线 ,( 以 及 
1 根 参考 地 线 ) 来 实现 大 量 数目 的 芯片 与 芯片 之 间 的 连接 。 另 外 一 些 总 线 , 例 如 .PCI 通过 地 址 
线 和 数据 线 复 用 的 方式 来 减少 连接 线 的 数目 。 一 个 传输 周期 分 为 地 址 节拍 加 上 一 个 或 多 个 数 
据 节拍 ,通过 控制 线 或 时 序 的 变换 来 区 分 是 地 址 节拍 还 是 数据 节拍 。 由 此 ,使 得 地 址 和 数据 的 
复 用 得 以 可 能 实现 。 

除了 地 址 线 与 数据 线 复 用 之 外 ,一 个 8 位 宽 的 字 节 ,或 一 个 16 位 宽 的 半 字 ,或 32 位 宽 的 
字 , 也 可 以 在 低 于 8 位 .16 位 .32 位 宽 的 数据 线 上 传输 。 这 要 根据 协议 要 求 , 按 顺序 逐步 传输 
一 个 数据 单元 的 各 个 部 分 。 由 此 看 来 ,节省 数据 线 的 宽度 是 以 多 个 传输 节拍 来 换取 空间 的 减 
少 , 即 以 时 间 换 空间 。 连 接线 减少 了 ,但 传输 的 时 延 加 长 了 ,在 设计 中 ,需要 在 硬件 和 软件 的 效 
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率 上 作 一 些 折 囊 处 理 。 

为 了 实现 数据 的 交互 ， 还 需要 有 相应 的 总 线 协 议 。 数 据 的 交互 按照 总 线 协 议 规定 的 方式 ， 
在 时 钟 信号 的 驱动 下 ,一 个 节拍 一 个 节拍 地 工作 。 总 线 主 设备 把 要 传送 的 数据 驱动 到 总 线 的 
数据 线 上 ,接收 设备 则 在 时 钟 信号 的 驱动 下 ,在 一 定 的 时 钟 信号 期 间 采 样 数据 信号 电 平 , 从 而 
获得 接收 数据 。 

总 线 协 议 规 定 了 什么 时 候 总 线 上 的 一 个 设备 能 获得 总 线 的 使 用 权 , 什 么 时 候 结 束 对 总 线 
的 占用 ,并 且 在 这 段 使 用 时 间 内 ,总 线 协 议定 义 了 什么 时 候 ( 时 钟 节拍 ?开始 地 址 的 传输 ,什么 
时 钟 节 拍 开始 数据 传输 ,什么 时 候 需 要 插 和 人 等 待 以 配合 设置 之 时 的 速度 快慢 。 

硬件 设计 人 员 会 设计 好 总 线 与 设备 之 间 的 物理 接口 ,为 设备 之 间 ,CPU 与 设备 之 间 进 行 
通信 与 数据 传输 建立 起 数据 传输 的 物理 基础 。 作 为 软件 设计 人 员 ,需要 了 解 这 些 传输 协议 才 
能 去 控制 数据 的 传输 ,实现 设计 预定 的 目标 。 

下 面 讲解 一 些 基 本 的 ,适合 于 各 种 总 线 的 原理 和 概念 ,以 及 以 点 代 面 地 介绍 几 种 常见 的 总 
线 , 从 而 让 读者 对 外 围 硬 件 设备 及 其 数据 交互 有 一 个 初步 认识 ,从 而 可 以 触 类 旁 通 地 学 习 和 研 
究 其 他 类 型 的 总 线 。 

1， 串 行 与 并 行 

串 行 是 所 传输 的 数据 位 按 一 个 比特 一 个 比特 位 顺序 传输 的 。 即 使 传输 线 上 数据 位 的 宽度 
只 有 1 位 。8 个 比特 位 才 组 成 一 个 字 节 数据 ,16 个 比特 位 组 成 一 个 16 位 数 ,32 位 组 成 一 个 32 
位 机 上 的 整数 类 型 的 数据 字 。 

与 之 相对 ,并 行 的 数据 线 的 宽度 往往 是 8 位 16 位 或 是 32 位 。 在 8 位 宽度 的 数据 线 上 传 
输 一 个 字 节 只 需要 一 个 传输 周期 ,但 可 能 需要 一 个 或 多 个 总 线 时 钟 周期 。 传 输 16 位 的 半 字 数 
据 需 要 两 个 传输 周期 ,同样 ,传输 一 个 32 位 的 数据 字 则 需要 4 个 时 钟 周期 。 

值得 注意 的 是 ,在 32 位 宽 的 并 行 总 线 上 也 可 以 传输 8 位 宽 的 字 节 数 据 , 或 是 16 位 宽 的 半 
字数 据 , 这 时 需要 有 一 个 屏蔽 掩 码 来 指示 32 位 数据 中 哪 几 位 是 有 效 位 。 在 设备 或 CPU 的 接 
收 端 , 则 只 采样 有 效 数据 位 。 屏 蔽 掩 码 有 可 能 是 协议 规定 好 的 ,也 有 可 能 是 硬件 设计 时 不 同 设 
备 指 定 的 。 软 件 设 计 中 在 接收 数据 时 需要 采样 指定 的 数据 位 ,或 是 在 发 送 数据 时 需要 把 有 效 
数据 放 在 特定 的 比特 位 上 。 

在 高 速 传输 系统 中 ,还 有 64 位 宽 的 数据 总 线 以 及 在 一 个 时 钟 周期 采样 2 次 或 4 次 数据 的 
总 线 , 因 而 极 大 的 提高 了 数据 的 吞吐 率 。 

除了 上 述 讲 到 的 位 宽 总 线 外 ,还 有 4 位 宽 的 总 线 ,例如 在 SDIO 模式 中 ,就 有 4 位 的 传输 
模式 。 在 4 位 宽 的 总 线 上 ,第 一 个 传输 周期 传输 一 个 字 节 数据 的 D0,D1,D2,D3 位 ,在 第 二 个 
传输 周期 传输 这 个 字 节 数据 的 高 4 位 。 

由 此 可 见 , 并 行 与 串 行 只 是 数据 位 宽 的 不 同 , 也 没有 绝对 的 界线 。 之 所 以 有 不 同位 宽 的 数 
据 总 线 , 只 不 过 是 在 物理 连 线 上 的 限制 。 总 线 时 钟 一 定 或 传输 周期 一 定 的 情况 下 ,位 宽 越 多 ， 
传输 的 速率 越 快 。 
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我 们 熟知 的 UART 就 是 串 行 的 ,打印 机 使 用 的 并 口 则 是 并 行 的 。 

2， 单 工 , 半 双 工 与 全 双 工 

单 工 是 指 设备 到 设备 之 间 的 数据 传输 方向 是 单一 的 ,一 条 或 一 组 数据 传输 线路 只 能 向 一 
个 方向 传输 数据 ,因此 与 单 工 工作 的 总 线 相连 的 设备 要 么 只 能 接收 ,要 么 只 能 发 送 ,不 能 既 接 
收 又 发 送 。 如 果 需 要 既 发 送 又 接收 , 则 需要 两 组 单 工 总 线 。 

半 双 工 , 指 在 一 个 时 刻 ,一 个 设备 只 能 发 送 ,不 能 接收 ;但 是 在 另外 的 时 刻 , 这 个 设备 可 以 
接收 ,但 不 能 发 送 。 即 是 说 ,在 同一 时 刻 ,数据 是 单 向 的 。 对 于 同一 时 刻 ,发 送 和 接收 需要 在 不 
同时 间 段 进行 ,发 送 和 接收 需要 作 总 线 的 切换 。 

全 双 工 则 是 发 送 端 和 接收 端 设 备 都 能 同时 进行 发 送 和 接收 。 

3. 主 设备 与 从 设备 

数据 传输 时 ,往往 有 一 个 设备 是 数据 传输 的 发 起 者 ,通常 称 为 主 设备 (master), 而 响应 数 
据 传 输 的 设备 称 为 从 设备 (slave) 。 

值得 注意 的 是 :数据 不 一 定 是 从 主 设备 传递 到 从 设备 ,也 有 可 能 是 由 从 设备 传 到 主 设备 。 
例如 : 主 设 备 发 起 一 次 读 操作 ,是 由 主 设备 向 从 设备 发 出 命令 ( 读 命令 :Read) ,而 后 从 设备 作 
出 响应 ,将 数据 由 从 设备 发 送 到 主 设备 ,如 此 完成 一 次 读 操作 。 

在 一 些 系统 中 , 主 设备 与 从 设备 不 是 绝对 的 ,一 个 设备 可 以 既是 主 设备 同时 又 是 从 设备 ， 
一 个 主 设备 也 可 以 变 成 从 设备 ,同样 ,一 个 从 设备 也 可 以 变 为 主 设备 。 一 个 显著 的 例子 ,就 是 
在 现在 流行 的 支持 USB - OTG 的 便携 式 设备 (例如 PDA) ,在 采用 一 种 专门 的 连接 线 把 这 个 
便携 式 设备 (PDA) 连 接 到 主机 时 , 它 可 以 当做 一 个 U 盘 从 PC 机 上 下 载 歌 曲 ,电影 到 这 个 
PDA 上 ,这 时 PDA 是 一 个 从 设备 。 另 一 方面 ,PDA 还 可 以 外 播 一 个 USB 的 U 盘 ,这 时 PDA 
需要 作为 一 个 主 设备 从 外 接 U 盘 上 读 取 数据 。 主 设备 与 从 设备 之 间 的 角色 互 换 需 要 遵循 总 
线 协 议 规定 。 

4， 总线 总 裁 器 

如 果 一 个 总 线 上 只 有 一 个 主 设备 ,那么 主 设备 在 任何 情况 下 都 知道 该 把 数据 发 送 到 哪 一 个 
从 设备 ,从 而 主 设备 在 任何 时 候 都 可 以 发 出 数据 操作 请 求 。 在 这 种 情况 下 , 主 设备 只 要 通过 一 种 
片 选 的 机 制 ,选中 一 个 从 设备 ,然后 在 它们 两 端 之 间 建 立 起 数据 通路 ,实现 数据 传输 就 可 以 了 。 

对 于 一 个 大 型 系统 ,通常 有 很 多 的 外 围 设 备 。 一 般 的 情况 是 ,多 个 设备 连接 到 一 个 总 线 
上 ,各 个 设备 在 需要 的 时 候 分 时 使 用 总 线 ,就 像 多 个 电话 用 户 共 用 同一 条 电话 主干 道 线 一 样 。 
这 种 情况 下 ,究竟 哪 一 对 设备 使 用 总 线 , 会 有 一 个 专门 的 硬件 模块 来 完成 总 裁 的 事情 ,这 个 硬 
件 模块 设备 称 之 为 总 裁 器 (arbitor) ,由 总 裁 器 来 裁决 下 一 次 传输 由 哪 一 个 主 设备 使 用 ,其 他 设 
备 在 这 个 时 间 段 不 得 占用 总 线 包 括 数据 线 和 控制 线 , 即 是 说 不 得 干预 控制 线 , 不 得 向 数据 线 上 
驱动 数据 ,也 不 得 采样 接收 数据 线 上 的 数据 。 总 线 在 设计 上 ,使 得 不 参与 数据 传输 的 设备 处 于 
“ 断 开 (如 “高 阻 ”) 状 态 。 
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总 线 总 裁 机 制 对 于 总 线 协 议 的 分 析 是 非常 重要 的 。 

s. 时 序 

总 线 是 连接 设备 与 设备 ,或 是 设备 与 CPU( 如 果 把 CPU 当做 设备 等 同 考 虑 的 话 ) 之 间 的 
物理 连接 通道 ,设备 与 设备 之 间 的 通信 与 数据 交互 遵循 总 线 协议 的 规定 。 

时 序 就 是 总 线 协 议 关 于 数据 传输 时 各 个 信和 号 线 随 时 间 变 化 的 状态 序列 图 , 它 是 数据 传输 
的 逻辑 图 。 总 线 上 都 有 一 个 总 线 时 钟 信号 ,数据 的 传输 就 是 在 这 个 时 钟 信号 的 节拍 中 ,一 拍 一 
拍 地 进行 着 。 时 钟 信号 是 一 维 向 前 的 。 一 个 总 线 时 序 图 规定 了 在 某 个 给 定 的 时 钟 拍 上 ,总 线 
上 什么 信号 该 有 效 , 该 如 何 变化 ;在 下 一 个 时 钟 节拍 上 ,又 是 哪些 信号 有 效 ,或 是 信号 状态 将 如 
何 改变 ,以 及 在 什么 时 钟点 ,发 送 端 设 备 应 该 将 数据 “ 放 ? 到 总 线 上 ,在 什么 时 钟点 ,接收 端 设备 
应 该 从 数据 线 上 采样 数据 。 时 序 图 构成 了 数据 传输 与 发 送 完 整 的 逻辑 关系 图 。 

6. 轮 询 与 中 断 

(1) 轮 询 

一 般 来 说 ,CPU 的 内 部 时 钟 比较 快 ,运算 速度 和 数据 传输 速度 都 比较 快 。 而 一 个 外 部 设 
备 所 工作 的 时 钟 和 数据 传输 速率 都 比较 低 。 另 一 方面 ,外 部 设备 是 否 已 经 准备 好 数据 ,或 者 组 
冲 是 否 为 空 , 以 接收 新 的 数据 ,这 些 信 息 都 需要 准确 地 告诉 CPU, 以 便 CPU 可 以 在 下 一 时 刻 
正确 地 发 送 或 接收 数据 。 

设备 何 时 处 于 数据 就 绪 状 态 ,或 者 何 时 处 于 数据 传输 完成 状态 ,这 些 事件 信息 可 以 通过 
CPU 周期 地 主动 查询 ,这 种 靠 CPU 主动 查询 设备 状态 的 方式 叫 轮 询 。 

由 于 CPU 查询 在 很 多 时 候 得 不 到 想 要 的 状态 ,这 种 查询 就 是 无 意义 地 浪费 CPU 的 时 
间 。 如 果 查 询 的 时 间 越 频繁 ,浪费 的 时 间 也 越 多 。 相 反 ,如果 查询 的 频率 太 少 , 则 可 能 丢失 一 
些 信 息 ,或 者 导致 一 个 外 部 设备 的 缓冲 区 溢出 ,从 而 丢失 数据 。 因 而 适当 设计 轮 询 的 时 间 间 隔 
是 非常 重要 的 。 无 论 如 何 , 轮 询 的 方式 浪费 CPU 的 大 量 时 间 , 外 部 设备 越 多 的 时 候 , 这 种 额 
外 负荷 就 更 重 。 

(2) 中 断 

另 一 种 方式 是 当 一 个 设备 有 新 的 事件 ,例如 :数据 准备 好 ,或 是 数据 传输 完成 ,或 者 是 一 个 
错误 发 生 ,或 者 是 一 个 设备 从 总 线 上 拔 出 ,或 者 是 一 个 设备 从 总 线 上 插 人 等 ,设备 都 可 以 主动 
向 CPU 报告 。 这 种 由 设备 主动 报告 的 方式 叫 中 断 。 ， 

由 于 中 断 可 以 暂停 CPU 对 现 有 程序 的 执行 来 及 时 响应 外 部 事务 的 请 求 ,所 以 中 断 方式 
是 一 种 非常 有 效 的 方式 。 中 断 方式 不 足 之 处 是 , 它 需 要 外 部 硬件 的 支持 ,同时 在 软件 上 需要 中 
断 处 理 程序 以 及 设备 驱动 程序 的 中 断 处 理 例 程 来 响应 中 断 进 行 处 理 。 

在 MO 中 断 方式 下 ,中央 处 理 器 与 IO 设备 之 间 数 据 的 传输 步骤 如 下 ， 

@ 在 某 个 进程 需要 数据 时 ,发 出 指令 启动 输入 /输出 设备 准备 数据 。 

凶 在 进程 发 出 指令 启动 设备 之 后 ,该 进程 会 进行 等 待 阻塞 状态 ,放弃 对 处 理 器 的 占用 ,等 
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待 相关 IO 操作 完成 。 此 时 ,进程 调度 程序 会 调度 其 他 就 绪 进 程 使 用 处 理 器 。 

@@ 当 IXO 操作 完成 时 ,输入 /输出 设备 控制 器 通过 中 断 请 求 线 向 处 理 器 发 出 中 断 信 和 号 ,处 
理 器 收 到 中 断 信 号 之 后 ,转向 预先 设计 好 的 中 断 处 理 程序 ,对 数据 传送 工作 进行 相应 的 处 理 。 

曲 得 到 了 数据 的 进程 , 转 人 就 绪 状 态 。 在 随后 的 某 个 时 刻 , 进程 调度 程序 会 选中 该 进程 
继续 工作 。 

(3) 中 断 方式 的 优 缺 点 

LI/XO 设备 中 断 方式 使 处 理 器 的 利用 率 提高 , 旦 能 支持 多 道 程序 和 IMO 设备 的 并 行 操作 。 

不 过 ,中 断 方式 仍然 存在 一 些 问 题 。 首 先 , 现 代 计 算 机 系统 通常 配置 有 各 种 各 样 的 输入 / 
输出 设备 。 如 果 这 些 MO 设备 都 通过 中 断 处 理 方式 进行 并 行 操作 ,那么 中 断 次 数 的 急剧 增加 
会 造成 CPU 无 法 响应 中 断 和 出 现 数据 丢失 现象 。 

其 次 ,如 果 IO 控制 器 的 数据 缓冲 区 比较 小 ,在 缓冲 区 装 满 数 据 之 后 将 会 发 生 中 断 。 那 
么 ,在 数据 传送 过 程 中 ,发 生 中 断 的 机 会 较 多 ,这 将 耗 去 大 量 的 CPU 处 理 时 间 。 所 以 中 疡 机 
制 还 必须 配合 其 他 传输 方式 来 有 效 地 提高 传输 效率 ,减少 系统 中 中 断 处 理 的 次 数 。 

7，DMA 


为 了 减少 中 断 的 次 数 , 一 个 解决 办 法 是 ,在 设备 内 部 设置 缓冲 区 ,增加 单 次 传输 数据 的 长 
度 ,批量 传 输 数据 ,从 而 减少 中 断 的 次 数 。 批 量 传输 的 数据 ,可 以 从 几 十字 节 到 几 开 ,甚至 几 十 
K 字 节 。 

当 一 个 设备 准备 好 接收 数据 或 是 有 新 的 数据 到 来 的 时 候 , 它 通过 中 断 的 方式 报告 CPU 
需要 进行 数据 的 传输 。 这 个 时 候 CPU 暂停 正在 执行 的 程序 或 是 正在 处 理 的 事务 , 转 而 进行 
新 的 数据 事务 的 处 理 。 

由 于 批量 传输 数据 ,CPU 要 耗费 大 量 的 时 间 来 从 慢 速 的 外 部 设备 读 或 写 一 批 数据 。 但 是 
这 个 时 候 如 果 CPU 正在 处 理 别 的 中 断 请 求 的 处 理 , 它 可 能 不 会 响应 新 的 中 断 请 求 , 因 为 在 一 
些 系统 中 ,中 断 不 允许 嵌 套 。 那 么 在 这 种 情况 下 ,新 的 数据 请 求 就 得 不 到 及 时 的 响应 ,可 能 导 
致 数据 委 失 。 

由 此 看 来 ,批量 传输 解决 了 中 断 次 数 过 于 频繁 的 问题 , 却 没有 解决 高 速 的 CPU 与 低速 的 
外 部 设备 之 间 传输 的 问题 。 

要 解决 这 个 问题 ,数据 的 传输 必须 由 一 个 专门 的 硬件 代理 来 负责 搬运 数据 ,CPU 只 负责 
处 理 中 断 请 求 , 并 开启 必要 的 传输 初始 化 的 处 理工 作 ,以 及 传输 结束 之 后 的 后 续 处 理工 作 。 外 
部 设备 在 负责 数据 搬运 的 过 程 中 ,CPU 可 以 进行 其 他 的 程序 执行 ,或 响应 新 的 中 断 请 求 。 这 
些 单独 负责 数据 搬运 的 硬件 模块 就 是 DMA。DMA 叫做 直接 内 存 存 取 , 即 :Direct Memory 
Aecess。DMA 是 指数 据 在 内 存 与 /O 设备 间 直 接 进行 成 块 传输 。 

(1) DMA 技术 特征 

DMA 有 两 个 技术 特征 ,首先 是 直接 传送 ,其 次 是 块 传送 。 

所 谓 直 接 传送 , 即 在 内 存 与 IO 设备 间 传 送 一 个 数据 块 的 过 程 中 ,不 需要 CPU 的 任何 中 
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间 干 涉 ,只 需要 CPU 在 过 程 开 始 时 向 设备 发 出 “传送 块 数据 ? 的 命令 ,然后 通过 中 断 来 得 知 过 
程 是 否 结束 和 下 次 操作 是 否 准备 就 绪 。 

(2) DMA 工作 过 程 

@ 当 进程 要 求 设 备 输入 数据 时 ,CPU 把 准备 存放 输入 数据 的 内 存 起 始 地 址 以 及 要 传送 
的 字 节 数 分 别 送 入 DMA 控制 器 中 的 内 存 地 址 寄存 器 和 传送 字 节 计数 器 。 

@ 发 出 数据 传输 请 求 的 进程 进入 等 待 状态 。 此 时 正在 执行 的 CPU 指令 被 暂时 挂 起 。 进 
程 调度 程序 调度 其 他 进程 占用 CPU。 

@ 输入 设备 不 断 地 窃取 CPU 工作 周期 ,将 数据 缓冲 寄存 器 中 的 数据 源源 不 断 地 写 人 内 
存 ,直到 所 请 求 的 字 节 全 部 传送 完毕 。 

@ DMA 控制 器 在 传送 完 所 有 字 节 时 ,通过 中 断 请 求 线 发 出 中 断 信 号 。CPU 在 接收 到 中 
断 信 号 后 , 转 人 中 断 处 理 程序 进行 后 续 处 理 。 

@@ 中 断 处理 结 束 后 ,CPU 返回 到 被 中 断 的 进程 中 ,或 切换 到 新 的 进程 上 下 文 环 境 中 继续 
执行 。 

(3) DMA 与 中 断 的 区 别 

@ 中 断 方式 是 在 数据 缓冲 寄存 器 满 之 后 发 出 中 断 ,要求 CPU 进行 中 断 处 理 , 而 DMA 方 
式 则 是 在 所 要 求 传送 的 数据 块 全 部 传送 结束 时 要 求 CPU 进行 中 断 处 理 。 这 就 大 大 减少 了 
CPU 进行 中 断 处 理 的 次 数 。 

@ 中 断 方式 的 数据 传送 是 在 中 断 处 理 时 由 CPU 控制 完成 的 ,而 DMA 方 式 则 是 在 DMA 
控制 器 的 控制 下 ,不 经 过 CPU 控制 完成 的 。 这 就 排除 了 CPU 因 并 行 设 备 过 多 而 来 不 及 处 理 
以 及 因 速 度 不 匹配 而 造成 数据 丢失 等 现象 。 

(4) DMA 方式 的 优 缺 点 

在 DMA 方式 中 ,由 于 IO 设备 直接 同 内 存 发 生成 块 的 数据 交换 ,因此 IO 效率 比较 高 。 
由 于 这 个 优点 ,DMA 技术 在 现代 计算 机 系统 中 ,得 到 了 广泛 的 应 用 。 许 多 输入 /输出 设备 的 
控制 器 ,特别 是 块 设备 的 控制 器 ,都 支持 DMA 方式 。 

通过 上 述 分 析 可 以 看 出 ,DMA 控制 器 功能 的 强 弱 是 决定 DMA 效率 的 关键 因素 。DMA 
控制 器 需要 为 每 次 数据 传送 做 大 量 的 工作 ,数据 传送 单位 的 增 大 意味 着 传送 次 数 的 减少 。 另 
外 ,DMA 方 式 窃 取 了 时 钟 周期 ,CPU 处 理 效率 降低 了 ,要 想 尽 量 少 地 窃取 时 钟 周期 ,就 要 设法 
提高 DMA 控制 器 的 性 能 ,从 而 减少 对 CPU 处 理 效率 的 影响 。 

8. 通道 方式 

输入 /输出 通道 是 一 个 独立 于 CPU 专门 管理 7O 的 处 理 机 , 它 控制 设备 与 内 存 直 接 进行 
数据 交换 。 它 有 自己 的 通道 指令 ,这 些 通道 指令 由 CPU 启动 ,并 在 操作 结束 时 向 CPU 发 出 
中 断 信号 。 

输入 /输出 通道 控制 是 一 种 以 内 存 为 中 心 ,实现 设备 和 内 存 直 接 交换 数据 的 控制 方式 。 在 
通道 方式 中 ,数据 的 传输 方向 、 存 放 数据 的 内 存 起 始 地 址 以 及 传输 的 数据 块 长 度 等 都 由 通道 来 


第 3 章 硬件 基础 


进行 控制 。 

另外 ,通道 控制 方式 可 以 做 到 一 个 通道 控制 多 台 设 备 与 内 存 进行 数据 交换 ,因此 ,通道 方 
式 进一步 减轻 了 CPU 的 工作 负担 ,增加 了 计算 机 系统 的 并 行 工作 速度 。 

通道 的 思想 是 从 早期 的 大 型 计算 机 系统 中 发 展 起 来 的 。 在 早期 的 大 型 计算 机 系统 中 ,一 
般配 有 大 量 的 IO 设备 。 为 了 把 对 IO 设备 的 管理 从 计算 机 主机 中 分 离 出 来 ,形成 了 I/O 通 
道 的 概念 ,并 专门 设计 出 了 IO 通道 处 理 机 。 

IO 通道 在 计算 机 系统 中 是 一 个 非常 重要 的 部 件 , 它 对 系统 整体 性 能 的 提高 起 了 相当 重 
要 的 作用 。 不 过 , 随 着 技术 不 断 的 发 展 , 处 理 机 和 LI/O 设备 性 能 的 不 断 提 高 ,专用 、 独 立 的 IO 
通道 处 理 机 已 不 常见 。 但 是 通道 的 思想 又 融 人 了 许多 新 的 技术 ,所 以 仍 在 广泛 地 应 用 着 。 由 
于 光纤 通道 技术 具有 数据 传输 速率 高 ,数据 传输 距离 远 以 及 可 简化 大 型 存储 系统 设计 的 优点 ， 
新 的 通用 光纤 通道 技术 正在 快速 发 展 。 这 种 通用 光纤 通道 可 以 在 一 个 通道 上 容纳 多 达 127 个 
大 容量 硬盘 驱动 器 。 显 然 , 在 大 容量 高 速 存储 应 用 领域 ,通用 光纤 通道 有 着 广泛 的 应 用 前 景 。 


3.3.2 EC 总 线 


1 了 EC 总 线 的 一 些 特 征 

EC 是 一 种 串 行 总 线 , 它 只 使 用 2 条 信号 线 ,1 条 是 串 行 数 据 线 SDA, 另 1 条 是 串 行 时 钟 
SCL。 除 此 之 外 还 有 1 条 地 线 , 共 3 条 连接 线 。 每 个 连接 到 总 线 的 器 件 都 可 以 通过 唯一 的 地 
址 进行 连接 , 主 设备 可 以 作为 主 设备 发 送 器 或 主 设备 接收 器 。 王 C 是 一 种 真正 的 多 主 设备 总 
线 , 如 果 两 个 或 多 个 主 设备 同时 发 起 数据 传输 ,可 以 通过 冲突 检测 和 仲裁 决定 由 哪个 主 设备 取 
得 总 线 的 控制 权 。 串 行 的 8 位 双向 数据 传输 ,位 速率 在 标准 模式 下 可 达 100 kb/s, 快 速 模 式 下 
可 达 400 kb/s, 高 速 模式 下 可 达 3.4 Mby/s。 

片上 的 滤波 器 可 以 滤 去 总 线 数据 线 上 的 毛刺 波 以 保证 数据 完整 ,连接 到 相同 总 线 上 的 IC 
数量 只 受到 总 线 的 最 大 电容 400 pF 所 限制 。 

EC 总 线 术 语 定义 如 表 3 -21 所 列 。 

表 3-21 EC 总 线 术语 定义 


备 | 发 起 传输 ,并 产生 时 钟 信号 和 终止 发 送 操作 的 器 件 
被 主 设备 寻 址 的 器 件 

同时 有 多 于 一 个 主 设备 党 试 控制 总 线 但 不 破坏 报 文 

| 仲裁 。 | 是 一 个 在 有 多 个 主 设备 同时 尝试 控制 总 线 但 只 允许 其 中 一 个 控制 总 线 并 使 报 文 不 被 破坏 的 过 程 


仲裁 
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无 论 是 微 控制 器 .LCD 驱动 器 .存储 器 或 键盘 接口 ,都 可 以 作为 一 个 发 送 器 或 接收 器 ,这 
由 器 件 的 功能 决定 。 很 明显 ,LCD 驱动 器 只 是 一 个 接收 器 ,而 存储 器 则 既 可 以 接收 又 可 以 发 
送 数据 。 除 了 发 送 器 和 接收 器 的 差别 之 外 ,在 执行 数据 传输 时 一 个 设备 可 以 被 看 作 是 主 设备 
或 是 从 设备 ,如 表 3- 21 所 列 。 主 设备 是 初始 化 总 线 上 数据 传输 并 产生 允许 传输 的 时 钟 信号 
的 器 件 , 此 时 任何 被 寻 址 的 器 件 都 被 看 作 是 从 设备 。 

EC 总 线 是 一 个 多 主 设 备 的 总 线 ,这 就 是 说 可 以 有 多 于 一 个 能 控制 总 线 的 主 设备 器 件 连 
接 到 总 线 。 不 过 通常 情况 下 , 主 设备 是 微 控制 器 。 

2. 位 传输 

由 于 连接 到 卫 C 总 线 的 器 件 有 不 同 种 类 的 工艺 ,CMOS NMOS 双 极 性 逻辑 0( 低 ) 和 1 
(高 ) 的 电 平 不 是 固定 的 , 它 由 Vop 的 相关 电 平 决定 ,每 传输 一 个 数据 位 就 产生 一 个 时 钟 脉冲 。 

(1) 数据 的 有 效 性 

SDA 线 上 的 数据 必须 在 时 钟 的 高 电 平 周 期 保持 稳定 ,数据 线 的 高 或 低 电 平 状态 只 有 在 
SCL 线 的 时 钟 信号 是 低 电 平时 才能 改变 ,如 图 3 -4 所 示 。 


SDA | 


数据 位 稳定 数据 允 训 
数据 有 效 ”允许 改变 


3-4 工 C 数 据 位 的 传输 


〈2) 起 始 和 停止 条 件 
在 工 C 总 线 中 唯一 出 现 的 是 被 定义 为 起 始 S 和 停止 P 条 件 的 情况 ,如 图 3 -5 所 示 。 


3-S$ LTC 起 始 条 件 和 停止 条 件 
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起 始 条 件 是 当 SCL 线 保持 为 高 电 平 ,SDA 线 由 高 电 平 向 低 电 平 切换 的 情况 ,被 当 作 是 EC | 赃 


一 次 事务 传输 的 开始 。 全 
停止 条 件 是 当 SCL 线 保持 为 高 电 平 ,SDA 线 由 低 电 平 向 高 电 平 切换 的 情况 ,被 当 作 是 PC | 深 
一 次 事务 传输 的 结束 。 件 
起 始 和 停止 条 件 一 般 由 主 设备 产生 ,总 线 在 起 始 条 件 后 被 认为 处 于 忙 的 状态 ,在 停止 条 件 | 设 
的 某 段 时 间 后 总 线 被 认为 再 次 处 于 空闲 状态 。 中 
3. 数据 传输 古 
(1) 字 节 格式 人 


发 送 到 SDA 线 上 的 每 个 字 节 必 须 为 8 位 ,每 次 传输 可 以 发 送 的 字 节 数量 不 受 限 制 , 每 个 | 方 
字 节 后 必须 跟 一 个 响应 位 ,首先 传输 的 是 数据 的 最 高 位 MSB。 如 果 从 设备 要 完成 一 些 内 部 处 “| 法 
理 功能 之 后 (例如 一 个 内 部 中 断 服务 程序 ) ,才能 接收 或 发 送 下 一 个 完整 的 数据 字 节 ,可 以 使 时 | . 
钟 线 SCL 保持 低 电 平 人 迫使 主 设备 进入 等 待 状 态 。 当 从 设备 准备 好 接收 下 一 个 数据 字 节 并 释 |107 
放 时 钟 线 SCL 后 数据 传输 继续 进行 

(2) 响 应 

数据 传输 必须 带 响应 ,相关 的 响应 时 钟 脉冲 由 主 设备 产生 。 在 响应 的 时 钟 脉冲 期 间 ,发 送 
器 释放 SDA 线 (高 阻 状态 ) ,接收 器 必须 将 SDA 线 拉 低 。 即 在 这 个 时 钟 脉冲 的 高 电 平 期 间 , 接 
收 器 将 SDA 保持 稳定 的 低 电 平 , 如 图 3 - 6 所 示 。 当 然 必 须 考虑 建立 和 保持 时 间 。 
设备 将 从 设备 将 响应 
线 拉 低 数据 线 拉 低 


1 | 
开始 条 件 响应 位 | 中 断 服 务 期 间 ，。 响应 位 
时 间 被 保持 为 全 人 
完成 一 个 字 节 
从 设备 内 部 中 断 


图 3-6 TC 总 线 数据 传输 时 序 图 
当 从 设备 不 能 响应 从 设备 地 址 〈 例 如 从 设备 正在 执行 的 一 些 实时 功能 不 能 接收 或 发 送 ) 
时 ,从 设备 使 数据 线 保持 高 电 平 , 主 设备 产生 一 个 停止 条 件 终止 传输 或 者 产生 重复 起 始 条 件 开 


始 新 的 传输 。 
如 果 从 设备 接收 器 响应 了 从 设备 地 址 ,但 是 在 传输 了 一 段 时 间 后 不 能 接收 更 多 数据 字 节 ， 
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这 时 主 设备 必须 再 一 次 终止 传输 。 

数据 传输 结束 时 ,由 主 设 备 产生 终止 条 件 , 开 CC 总线 被 释放 。 

4. 仲裁 和 时 钟 发 生 

(1) 同 步 

所 有 的 主 设备 在 SCL 线 上 产生 它们 自己 的 时 钟 ,从 而 在 下 C 总 线 上 传输 数据 消息 。 数 据 
只 在 时 钟 周期 的 高 电 平 有 效 , 因 此 需要 确定 的 时 钟 来 进行 逐 位 仲裁 。 

时 钟 同 步 通过 工 C 接口 与 SCL 线 “ 与 ?连接 来 实现 。 

(2) 仲 载 

主 设备 只 能 在 总 线 空闲 的 时 候 启 动 传输 。 两 个 或 多 个 主 设备 可 以 在 起 始 条 件 的 最 小 持续 
时 间 tnpsrA 内 产生 一 个 起 始 条 件 , 它 会 导致 在 总 线 上 产生 一 个 如 协议 定义 的 起 始 条 件 。 

当 SCL 线 是 高 电 平时 ,仲裁 在 SDA 线 上 发 生 。 当 一 个 主 设备 在 数据 线 SDA 上 发 送 高 电 
平 , 而 其 他 主 设备 在 SDA 线 上 发 送 低 电 平时 ,发 送 高 电 平 的 主 设备 将 断 开 它 的 数据 输出 ,因为 
总 线 上 的 电 平 与 它 自己 的 电 平 不 相同 ,从 而 竞争 失败 。 

仲裁 可 以 持续 多 位 , 它 的 第 一 个 阶段 是 比较 地 址 位 有 关 的 寻 址 信息 ,如 果 每 个 主 设备 都 尝 
试 寻 址 相同 的 器 件 ,仲裁 会 继续 比较 数据 位 (如 果 是 主 设备 发 送 器 ) ,或 者 比较 响应 位 (如 果 是 
主 设备 接收 器 ), 因 为 卫 C 总 线 的 地 址 和 数据 信息 由 赢得 仲裁 的 主 设备 决定 ,在 仲裁 过 程 中 不 
会 丢失 信息 ,丢失 仲裁 的 主 设备 可 以 产生 时 钟 脉冲 ,直到 丢失 仲裁 的 该 字 节 末尾 。 

小 结 : 

由 于 下 C 的 时 间 线 SCL 和 数据 线 SDA 通过 “与 ?连接 ,所 以 如 果 一 个 主 设备 发 送 高 电 平 ， 
而 其 他 主 设备 发 送 低 电 平 , 由 于 相 “与 ?的 结果 为 低 , 从 而 导致 SCL 或 SDA 上 的 电 平 状 态 与 发 
送 高 电 平 的 主 设备 所 发 送 的 电 平 不 一 致 ,从 而 失去 总 线 控制 权 。 由 此 看 出 ,下 C 的 总 线 仲裁 可 
能 需要 持续 很 长 时 间 ,甚至 可 能 持续 到 一 次 传输 快要 结束 的 响应 周期 。 


3.3.3 PCI 总 线 


PCI 是 一 种 并 行 总 线 , 作 为 微机 系统 的 骨架 广泛 用 于 个 人 电脑 ,以 及 其 他 电子 设备 如 数字 
电视 中 。 

PCI 的 总 线 位 宽 是 32 位 ,其 总 线 的 同步 工作 频率 可 达到 33 MHz, 后 期 的 版 本 从 位 宽 到 时 
钟 频率 都 提高 了 。 

对 于 一 个 总 线 主 设备 ,PCI 接口 至 少 需要 49 条 信和 号 线 , 从 设备 至 少 需要 47 条 信和 号 线 。 它 
们 包括 数据 线 .地 址 线 和 接口 控制 线 。 

1. PCI 总 线 信号 描述 

(1) 系统 信号 

@ CLK 总 线 时 钟 信号 ; 


第 3 章 硬件 基础 


@O RES 间 # 系统 复位 信号 。 

〈2) 地 址 和 数据 信号 、 

中 ADL31 : 0] 地 址 数据 多 数 复 用 信和 号; 

@ C/BE[3 : 0] 总 线 命令 和 字 节 人 允许 信号 ; 

号 PAR 奇偶 校 验 信和 号 

《3) 接口 控制 信号 

@ FRAME# 帧 周期 信号 。 双 向 三 态 , 低 电 平 有 效 。 由 当前 总 线 主 设备 驱动 。 表示 一 
个 总 线 周 期 的 开始 和 结束 。 当 该 信号 有 效 时 ,表示 开始 总 线 的 传输 操作 。ADL31 : 0] 和 C/ 
BFL3 : 0] 上 传送 的 是 有 效 地 址 和 命令 。 在 整个 总 线 周 期 内 ,FRAME# 一 直 操 持 有 效 , 当 
FRAME# 变 为 高 电 平时 ,表示 进入 最 后 一 个 数据 节拍 ,本 次 总 线 操 作 结 束 。 

G@ IRDY# ， 主 设备 准备 好 信号 。 双 向 三 态 , 低 电 平 有 效 。 该 信号 由 当前 总 线 主 设备 驱 
动 。 它 与 TRDY 井 同时 有 效 可 完成 数据 的 传输 。 在 写 周 期 RDY# 表 示 ADL31 : 0] 上 数据 有 
效 ;: 在 读 信和 号 周期 该 信号 表示 主 设备 已 经 准备 好 接收 数据 。 

@@ TRDY# 从 设备 准备 好 信号。 双向 三 态 , 低 电 平 有 效 , 从 设备 驱动 。 当 该 信和 导 有 效 , 表 
示 从 设备 准备 好 传送 数据 。 在 写 周 期 ,表示 从 设备 准备 好 接收 数据 ;在读 周期 ,表示 ADL31 : 0] 
上 的 数据 有 效 。 

井 STOP# 从 设备 要 求 总 线 主 设备 停止 当前 数据 传送 。 双 向 三 态 , 低 电 平 有 效 , 从 设备 
驱动 。 用 于 请 求 总 线 主 设备 停止 当前 数据 传送 。 

加 LOCK# 锁定 信号 。 双 向 三 态 , 低 电 平 有 效 , 主 设备 驱动 。 当 该 信号 有 效 , 用 于 保证 
主 设备 对 存储 器 的 锁定 操作 。 

@ IDSEL 初始 化 设备 选择 信号 。 输 入 信号 ,高 电 平 有 效 。 在 配置 读 写 操作 阶段 ,用 于 
芯片 的 选择 。 

@ DEVSEL# 设备 选择 信和 号。 双向 三 态 , 低 电 平 有 效 , 从 设备 驱动 。 当 该 信号 有 效 时 
〈 输 出 ) ,表示 所 译 码 的 地 址 是 在 设备 的 地 址 范围 之 内 。 

〈4) 总 裁 信号 

中 REQ# 总线 请 求 信号 。 双 向 三 态 , 低 电 平 有 效 , 由 希望 成 为 总 线 主 控 设 备 的 设备 驱 
动 。 它 是 一 个 点 对 点 的 信号 ,并 且 每 一 个 主 控 设 备 都 有 自己 的 REQ 间 # 。 

@ GNT# ， 总线 请 求 允 许 信号 。 双 向 三 态 , 低 电 平 有 效 。 当 该 信号 有 效 时 ,表示 总 线 请 
求 被 响应 。 这 也 是 一 个 点 对 点 的 信号 ,并 且 每 一 个 主 控 设 备 都 有 自己 的 GNTI# 。 

《5) 中 断 请 求 信号 

INTx# 中 断 请 求 信号 (x = A,B,C,D)。PCI 为 每 一 个 单 功能 设备 定义 了 一 根 中 断 
线 。 对 于 多 功能 设备 ,最 多 可 有 4 条 中 断 线 。 对 于 单 功能 设备 ,只 能 使 用 INTA# 。 多 功能 设 
备 的 任何 一 种 功能 都 可 以 连接 到 任何 一 条 中 断 线 上 。 如 果 一 个 设备 只 用 到 一 条 中 断 线 , 则 连 
接 到 INTA# ,如 果 用 到 两 条 中 断 线 , 则 连接 到 INTA# 和 IJNTB# ,以 此 类 推 。 
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笑 (6) 其 他 信号 线 


入 略 。 
人 2.PCI 总 线 命令 
下 PCI 总 线 命令 如 表 3 - 22 所 列 。 


表 3-22 PCI 总 线 命令 


龟 0000 中 断 响应 中 断 识别 命令 
YY 
苇 0001 特殊 周期 


只 要 FRAME# 有 效 ,就 应 保持 管道 的 连续 ,以 便 传送 大 量 的 数据 
高 速 缓存 读 用 于 多 于 32 位 的 数据 


3. PCI 总 线 协议 基础 

PCI 总 线 协议 支持 狂 发 性 (burst) 成 组 数据 传输 。 基 本 的 PCI 传输 由 3 条 信和 号 线 控制 : 

画 FRAME 间 该 信号 由 主 控 设 备 驱动 ,表示 总 线 操 作 的 开始 和 结束 。 

图 IRDY 间 该 信号 由 主 控 设 备 驱动 ,允许 插入 等 待 周期 。 

国 TRDY 间 该 信号 由 从 设备 驱动 ,允许 插入 等 待 周期 。 

(1) PCI 地 址 空间 

PCI 定 义 了 3 个 物理 空间 ,分别 是 :存储 器 地 址 空间 ,IO 地 址 空间 和 配置 地 址 空间 。 其 
中 :存储 器 地 址 空间 是 PCI 设备 内 部 使 用 的 存储 器 地 址 空间 ,I/O 地 址 空间 是 PCI 设备 内 部 使 
用 的 MO 端口 的 地 址 及 范围 。 配 置地 址 空间 是 对 PCI 设备 自身 进行 配置 的 寄存 器 空间 ,是 一 
个 PCI 设 备 必 须 实现 的 ,是 一 个 系统 中 的 PCI 总 线 控制 器 对 一 个 PCI 设 备 进行 操控 的 寄存 器 
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空间 。 

除了 配置 空间 之 外 ,存储 器 空间 与 IO 空间 是 由 PCI 设备 自己 进行 负责 的 ,PCI 设备 自身 
负责 译 码 的 工作 。 

PCI 的 一 个 重要 特性 就 是 资源 动态 配置 ,不 像 串口 或 并 口 那样 使 用 固定 的 0x3F7, 或 
0xlF7 那样 的 固定 IO 端口 地 址 。PCI 总 线 控制 器 通过 访问 一 个 PCI 的 配置 空间 来 获取 配置 
信息 ,然后 从 系统 资源 中 动态 为 一 个 PCI 设备 分 配 存储 资源 .VO 资源 以 及 中 断 资 源 。 由 此 ， 
PCI 实现 了 即 插 即 用 的 功能 而 无 需 通过 硬件 的 跳 线 或 是 软件 端口 的 指定 来 使 用 一 个 设备 ,从 
而 解决 了 在 一 个 复杂 系统 中 资源 分 配 的 问题 。 

(2) PCI 的 总 线 管 理 规 则 

外 由 FRAME 并 和 IRDY# 定 义 总 线 忙 和 总 线 空 闲 状态 。 当 其 中 一 个 信号 有 效 , 则 表示 
总 线 忙 。 当 两 个 信号 都 无 效 的 时 候 ,总线 进入 空闲 状态 。 

@ 一 旦 FRAM# 被 置 为 无 效 ,在 同一 传输 周期 不 能 被 重新 设置 。 

图 除非 IRDY# 被 设置 为 无 效 ,一 般 情 况 下 不 能 设置 FRAME# 无 效 。 

4. PCI 总 线 的 总 裁 

在 一 个 给 定 的 时 间 内 ,PCI 总 线 上 只 有 一 个 总 线 主 控 设 备 ( 主 设备 ),PCI 系统 有 一 个 中 央 
仲裁 电路 , 它 即 是 PCI 总 裁 器 ,由 总 线 仲裁 器 设 定 哪 一 个 主 设备 控制 总 线 , 并 将 控制 总 线 设备 
的 GNT# 信和 号 置 为 有 效 。PCI 总 线 执行 中 心 促 裁 机 制 ,中 心 仲裁 机 制 使 用 旋转 优先 级 和 公平 
性 等 原则 ,是 最 坏 情 况 下 的 仲裁 基础 。 

仲裁 信号 线 : 

国 REQ# 总 线 请 求 信 号 。 

国 GNT 间 总 线 请 求 响应 信和 号 。 


在 PCI 系 统 中 ,每 个 总 线 主 设备 都 有 一 个 唯一 的 请 求 (REQ# ) 和 人 允许 (GNT# ) 信 号 。 仲 


裁 器 可 以 在 任何 时 钟 置 某 一 个 设备 的 GNT# 无效。 当 某 一 个 设备 利用 PCI 总 线 传 输 数据 时 ， 
必须 保证 它 的 GNT# 信和 号 在 时 钟 的 前 沿 被 设置 。 仲 裁 基本 协议 如 下 : 

G@ 若 设置 了 GNT# 有效 和 FRAME# 无 效 ,当前 的 传输 有 效 且 能 够 继续 下 去 。 

@ 如 果 总 线 不 在 空闲 状态 (IDLE) ,一 个 设备 的 GNT# 信 号 有 效 和 另 一 个 设备 的 GNT 间 
信和 号 无 效 之 间 必 须 有 一 个 延 时 时 间 ,否则 会 在 AD 线 和 了 PAR 线 上 出 现时 序 竞争 。 

@@ 当 FRAME# 无 效 时 ,为 了 响应 优先 级 更 高 的 主 设备 的 服务 ,可 以 在 任意 时 刻 置 GNT# 
和 REQ 间 无 效 。 若 总 线 占用 者 在 GNT# 和 REQ# 设置 后 ,在 16 个 PCI 时 钟 周期 以 后 还 没 
有 开始 传输 ,仲裁 器 可 以 在 以 后 的 任意 一 个 时 刻 移 去 GNT# 信 号 ,以 响应 一 个 优先 级 更 高 的 
设备 。 

当 总 线 拥 有 者 传送 多 个 数据 时 ,应 保持 REQ# 有 效 。 如 果 没 有 别 的 设备 请 求 总 线 , 或 当 
前 总 线 主 控 设 备 具 有 最 高 优先 级 ,仲裁 器 将 会 一 直 让 当前 总 线 主 控 设 备 继续 使 用 总 线 。 

从 设备 可 以 在 任何 时 候 使 REQ# 无 效 ,撤销 总 线 请 求 , 相 应 的 ,总线 仲裁 器 将 会 使 GNT# 无 
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效 。 如 果 某 一 单元 只 想 作 一 次 传送 操作 , 它 将 在 FRAME# 有 效 的 同一 个 时 钟 使 REQ # 无 
效 。 当 从 设备 中 止 某 一 传送 时 (STOP# 有 效 ) ,总 线 主 控 设备 必须 在 两 个 PCI 时 钟 周 期 内 使 
REQ 划 无 效 ,使 总 线 回 到 IDLE 状态 。 如 果 总 线 主 控 设 备 想 继续 传送 ,必须 重新 使 REQ 间 
有 效 。 

如 果 当 前 总 线 主 控 设备 的 GNT# 已 经 有 效 后 ,但 是 没有 开始 操作 (其 REQ# 也 有 效 ) ,并 
且 在 16 个 PCI 时 钟 内 总 线 仍 处 于 IDLE 状态 , 则 仲裁 器 可 以 假定 当前 总 线 主 控 设 备 “ 断 路 ”， 
然后 ,仲裁 器 可 以 在 任何 时 候 切换 GNT 间 ,为 更 高 优先 级 的 设备 服务 。 


sS，PCI 总 线 传 输 

PCI 是 地 址 /数据 复 用 总 线 ,每 一 个 PCI 总线 传 送 由 两 个 节拍 组 成 :地 址 节拍 和 数据 节拍 。 
一 个 地 址 节拍 由 FRAME## 信 号 从 非 激 活 状态 (高 电 平 ) 转 换 到 激活 状态 ( 低 电 平 ) 的 时 钟 周期 
开始 。 在 地 址 节拍 ,总 线 主 设备 通过 C/BE[3 : 0]# 端 发 送 总 线 命令 ,如 果 是 总 线 读 命令 , 紧 
接着 地 址 节拍 的 时 钟 周 期 叫 总 线 转换 周期 ,在 这 一 个 时 钟 周 期 内 ,AD[31 : 0] 既 不 被 主 设备 驱 
动 也 不 被 从 设备 驱动 ,以 避免 总 线 冲 突 。 对 于 写 操作 ,就 没有 总 线 转换 周期 ， 总 线 直 接 从 地 址 
节拍 进入 到 数据 节拍 。 

所 有 的 PCI 总 线 传 送 由 一 个 地 址 节拍 和 一 个 或 多 个 数据 节拍 组 成 ,地 址 节拍 的 时 间 是 一 
个 PCI 时 钟 周 期 ,数据 节拍 数 取 决 于 要 传送 的 数据 个 数 , 一 个 数据 节拍 至 少 需要 一 个 PCI 时 
钟 周 期 ,在 任何 一 个 数据 节拍 都 可 以 插入 等 待 周 期 。FRAME# 从 有 效 变 成 无 效 表 示 当 前 正 
在 进行 最 后 一 个 节拍 。 

总 线 操作 结束 有 多 种 方式 ,大 多 数 情况 下 ,由 从 设备 和 主 设备 共同 撤销 设备 就 绪 信 号， 


，TRDY# 和 IJIRDY# ;如 果 从 设备 不 能 够 继续 传送 ,可 以 设置 STOP# 信号 ,表示 从 设备 撤销 与 


总 线 的 连接 ;所 寻 址 的 从 设备 不 存在 或 者 DEVSEL# 信和 号 一 直 为 无 效 状 态 都 可 能 导致 主 设备 
结束 当前 总 线 操作 ,使 FRAME# 和 ERDY# 变 成 无 效 , 回 到 总 线 空闲 状态 。 

在 存储 器 指令 传送 期 间 , 所 有 从 设备 都 应 检查 AD[1 : 0] ,并 且 提 供 所 要 求 的 狂 发 顺序 ,或 在 
每 一 个 数据 节拍 之 后 让 从 设备 脱离 总 线 。 所 有 支持 猴 发 的 设备 都 要 求 线性 触发 顺序 。 对 于 采用 
高 速 缓存 线 触发 器 没有 这 种 要 求 。 在 存储 器 空间 ,是 对 由 AD[31 : 2] 进 行 译 码 所 得 到 的 双 字 地 
址 进行 操作 ,在 线性 增加 模式 下 ,在 每 个 数据 节拍 之 后 ,地 址 增加 4 个 字 节 ,直到 传送 结束 。 

在 存储 指令 期 间 ,AD[1 : 0] 有 如 下 意义 : 


RD1 RDO 锤 发 顺序 

0 0 线性 增加 

0 高 速 缓存 线 触发 器 模式 
1 区 保留 

6。PCI 配置 周期 


系统 必须 提供 由 软件 产生 PCI 配置 周期 的 机 制 。 这 种 机 制 一 般 存 在 于 主 桥 路 中 。PCI 定 
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义 两 种 不 同 的 机 制 , 即 配置 机 制 1# 和 配置 机 制 2# 。 通 常 采用 配置 机 制 1#, 且 所 有 以 后 的 
主 桥 路 都 要 提供 这 种 机 制 。 

配置 机 制 1# 使 用 两 个 MO 地 址 。 在 PC 机 中 ,第 一 个 双 字 地 址 是 (CF8H) ,是 一 个 可 读 
写 的 寄存 器 ,命名 为 CONFIG - ADDRESS。 第 二 个 地 址 是 (CCFCH) ,命名 为 CONFIG - DA- 
TA 寄存 器 。 对 配置 空间 的 操作 是 通过 写 一 个 值 到 CONFIG - ADDRESS 寄存 器 。 在 此 之 后 
如 果 对 CONFIG - DATA 寄存 器 进行 读 或 写 的 操作 , 桥 就 会 将 CONFIG - ADDRESS 寄存 器 
中 的 值 转换 成 PCI 总 线 上 所 要 求 的 配置 周期 , 即 自动 产生 配置 读 和 配置 写 周 期 。 

CONFIG -ADDRESS 寄存 器 是 一 个 32 位 寄存 器 ,其 格式 如 图 3 -7 所 示 。Bit31 是 允许 
位 ,bit30 到 bit24 保留 ,只 读 , 其 返回 必须 是 全 0。Bit23 到 bit16 选择 系统 中 特定 的 总 线 。 
Bit15 到 bitll 选择 一 个 特定 总 线 上 的 某 个 设备 , Bit10 到 bit8 选择 一 个 PCI 设备 中 特定 的 功 
能 (如 果 一 个 PCI 设备 支持 多 个 功能 ) 。Bit7 到 bit2 选择 设备 配置 空间 中 的 配置 寄存 器 。Bitl 
和 bit0 是 只 读 字段 ,上 且 在 读 的 时 候 必 须 返 回 为 全 0。 


31 24 23 16 15 11 10 8 7 21 0 

| 保留 | 总线 号 | 设备 号 | 功能 号 | 寄存 器 号 | 0| 0| 
允许 位 ，1= 人 允许 
(0= 禁 止 


图 3-7 PCI CONEFIG - ADDRESS 寄存 器 格式 


无 论 何 时 , 主 桥 路 只 要 检测 到 对 CONFIG - ADDRESS 寄存 器 的 写 操作 ,该 桥 路 就 把 数据 
写 人 到 自己 内 部 的 CONFIG - ADDRESS 寄存 器 中 ,在读 CONFIG - ADDRESS 寄存 器 时 , 桥 
路 将 返回 到 CONFIG - ADDRESS 中 的 数据 。 该 寄存 器 所 占用 的 O 空间 的 一 个 地 址 ,可 以 
对 它 进行 Byte( 字 节 ) 和 WORD( 字 ) 操 作 。 

当 桥 路 检测 到 对 CONFIG - DATA 寄存 器 的 读 写 操作 时 , 它 先 检查 CONFIG - AD- 
DRESS 寄存 器 中 的 允许 位 和 总 线 号 ,如 果 人 允许 位 等 于 1, 且 总 线 号 与 设备 的 总 线 号 相符 ,就 允 
许配 置 周 期 传送 。 

7. PCI 配置 空间 

为 了 实现 参数 的 自动 配置 ,每 个 PCI 设备 都 必须 支持 256 字 节 的 配置 空间 ,其 中 ,前 64 字 
节 是 必须 支持 的 。 后 面 64 一 255 字 节 是 由 设备 自 定义 的 字段 。PCI 总 线 驱动 依赖 于 这 64 字 
节 的 配置 空间 头 部 ,对 系统 中 所 有 的 PCI 总 线 上 的 所 有 设备 进行 自动 配置 。 

图 3 -8 显示 了 PCI 类 型 0 配置 空间 的 头 部 。 其 中 : 

地 址 0x00 是 厂家 标识 ,2 字 节 。 

地 址 0x02 是 设备 标识 ,2 字 节 。 

地 址 0x04 是 PCI 命令 寄存 器 ,2 字 节 。PCI 命令 寄存 器 用 于 存放 PCI 命令 ,这 些 命令 由 
PCI 标准 规定 ,适用 于 所 有 的 PCI 设备 。 
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31 16 15 0 
00h 
状态 (Status 04h 
类 代码 (Class Code) 08h 
och 
基地 址 寄存 器 (Base Address Registen 0 10h 
基地 址 寄存 器 1 14h 


Cardbus CIS Pointer 28h 


2Ch 
于 一 34h 
3Ch 


图 3-8 PCI 类 型 0 配置 空间 头 部 


地 址 0x06 是 PCI 状态 寄存 器 ,2 字 节 。16 位 状态 寄存 器 包含 PCI 的 状态 ,该 寄存 器 的 功 
能 由 PCI 标准 规定 。 

地 址 0x08 是 PCI 版 本 标识 ,1 字 节 。 

地 址 0x09 是 类 代码 寄存 器 ,3 字 节 。 该 寄存 器 分 3 节 , 其 中 高 字 节 (0x0B) 是 基本 类 ,中 间 
字 节 (0x0A) 是 子 类 ,最低 字 节 (0x09) 说 明 特定 寄存 器 编程 接口 。 

地 址 0x0C 是 高 速 缓存 大 小 寄存 器 ,1 字 节 。 

地 址 0x0D 是 延 时 定时 器 ,1 字 节 。 

地 址 0x0E 是 头 部 类 型 ,1 字 节 。 

地 址 0xOF 是 内 部 自 检 寄存 器 ,1 字 节 。 

地 址 0xl0~0x27 共 6 个 32 位 的 基地 址 寄存 器 。 用 来 说 明 PCI 设备 内 部 所 使 用 的 存储 器 
地 址 空间 ,或 是 IO 地 址 空间 的 属性 。 通 过 这 些 基 地 址 的 读 操作 ,可 以 从 返回 值 判断 该 地 址 
所 对 应 的 空间 是 存储 器 空间 ,还 是 IO 空间 ,并 且 计 算出 所 指示 空间 的 大 小 。 然 后 系统 配置 
软件 从 系统 的 存储 资源 (空间 ), 或 是 IO 资源 (空间 ) 为 这 个 PCI 设备 分 配 相 应 的 资源 ,并 将 
基地 址 写 人 到 对 应 的 基地 址 寄存 器 中 ,从 而 实现 对 这 个 PCI 设备 的 地 址 空间 的 配置 。 

地 址 0x30 是 扩充 ROM 基地 址 ,4 字 节 。 

地 址 0x3C 是 中 断 线 寄存 器 ,1 字 节 。 

地 址 0x3D 是 中 断 引 脚 寄存 器 ,1 字 节 。 

地 址 0x3E 是 最 小 允许 时 间 ,1 字 节 。 

地 址 0x3F 是 最 大 延迟 时 间 ,1 字 节 。 
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8. PCI 设备 的 初始 化 

所 有 的 PCI 设备 以 及 PCI 桥 都 需要 执行 PCI 初始 化 操作 。 系 统 中 如 果 有 多 个 PCI 设备 
存在 时 ,对 于 每 一 个 设备 ,都 需要 实现 最 基本 的 配置 寄存 器 。 设 备 的 配置 寄存 器 空间 是 通过 
IDSEL 信和 号 来 选择 的 ,在 软件 实现 时 ,是 通过 CONEFIG - ADDRESS 寄存 器 来 指定 。 

PCI 总 线 上 的 设备 在 复位 以 后 ,主机 进入 对 该 设备 的 配置 周期 ,主机 通过 查询 ( 读 ) 配 置 寄 
存 器 获得 PCI 设备 的 基本 信息 ,包括 资源 需求 信息 ,例如 所 需要 的 存储 器 空间 和 LO 空间 的 
大 小 ,中 断 线 寄存 器 ,中 断 引 脚 线 的 连接 情况 。 主 机 软件 然后 根据 系统 资源 决定 是 否 能 够 初始 
化 这 个 PCI 设 备 , 如 果 是 ,那么 将 对 存储 器 、.I/VO 基地 址 .中断 请 求 线 和 中 断 寄 存 器 写 人 系统 软 
件 所 分 配 的 值 。 


3.3.4 设备 模型 


理解 了 总 线 ,再 来 看 各 种 各 样 的 设备 就 会 变 得 非常 简单 。 设 备 不 外 乎 是 总 线 上 的 一 个 终 
端 , 它 是 数据 传输 的 目标 。 

尽管 设备 的 种 类 复杂 多 样 , 但 可 以 把 一 个 外 部 设备 当 作 一 个 数据 处 理 机 。 从 数据 流 的 角 
度 上 来 说 ,一 个 设备 总 是 需要 跟 中 央 处 理 器 (CPU) 进 行 通信 。 从 CPU 那里 获得 输出 数据 ,或 
者 给 CPU 提供 输入 数据 。 除 此 之 外 ,一 个 设备 还 需要 从 CPU 那里 获取 指令 ,执行 某 种 类 型 
的 操作 。 

与 编写 一 个 程序 模块 一 样 ,一 个 程序 模块 具备 数据 ,而 这 个 模块 会 根据 各 种 不 同 的 调用 对 
数据 执行 操作 。 从 这 个 意义 上 说 ,一 个 外 部 设备 不 外 乎 有 4 个 方面 的 任务 ,归纳 如 下 : 

@@ 产生 数据 ,输入 到 CPU 。 

@ 接收 数据 ,从 CPU 输出 。 

@@ 处 理 数据 ,从 CPU 接受 指令 。 

田 状态 报告 ,反馈 到 CPU。 

. 其 中 ,状态 报告 是 伴随 前 3 个 操作 的 过 程 而 发 生 的 。 

当然 ,这 里 只 是 一 个 简化 的 模型 ,首先 假定 设备 只 是 与 CPU 相连 的 。 在 一 个 系统 中 , 除 
了 CPU 可 以 管理 一 个 外 部 设备 ,一 个 外 部 设备 还 可 以 管理 特别 的 外 部 设备 ,通常 这 类 可 以 管 
理 别 的 外 部 设备 的 设备 就 是 一 个 总 线 控制 器 。 例 如 :USB 总 线 控制 器 ,或 是 一 个 下 C 控制 器 ， 
它们 的 连接 线 上 ,可 以 挂 接 很 多 同类 型 的 接口 设备 。 这 就 是 前 面 所 讨论 的 各 种 各 样 的 总 线 。 

有 了 这 个 直观 的 概念 之 后 ,理解 一 个 设备 的 行为 就 变 得 简单 ,就 可 以 逐个 进行 分 析 。 

1. 产生 数据 

产生 数据 的 设备 很 多 ,例如 :大 家 日 常 使 用 的 鼠标 ,键盘 ,它们 会 产生 一 个 扫描 码 , 或 是 鼠 
标 移 动 的 一 个 方向 偏 移 , 以 及 鼠标 键 按 下 的 动作 码 。 这 些 简 单 的 编码 将 实时 报告 给 CPU , 提 
示 一 个 外 部 的 输入 操作 。 
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其 次 ,声音 输入 设备 的 麦克 风 也 能 够 产生 数据 , 它 把 外 部 的 声音 事件 ,经 过 模 数 转换 形成 
PCM 采样 码 ,这 些 编码 相对 于 鼠标 键盘 产生 的 单一 编码 而 言 , 更 加 复杂 ,其 数据 量 也 增加 了 
维度 。 

另外 还 有 视频 采集 卡 或 是 一 个 摄像 头 , 它 所 产生 的 数据 可 以 认为 是 3 个 维度 ,2 个 维度 是 
空间 的 ,1 个 维度 是 时 间 的 。 

除了 上 面 所 列举 的 这 些 日 常熟 知 的 例子 外 ,还 有 很 多 其 他 的 输入 设备 ,例如 触摸 屏 .手写 
笔 、 条 形 扫描 终端 .扫描 仪 和 工业 控制 当中 的 传感器 的 数字 接口 等 ,它们 都 是 输入 设备 。 

下 面 先 从 键盘 这 个 简单 的 例子 来 考察 一 个 外 部 设备 ,看 看 需要 配备 什么 样 的 措施 才能 实 
现 与 CPU 相互 间 的 数据 和 信息 交互 。 

输入 设备 要 把 采集 到 的 数据 ,或 是 一 个 设备 内 部 产生 的 数据 传递 给 CPU , 它 必 须要 完成 
两 件 事情 。 

第 一 :向 CPU 报告 外 部 设备 有 数据 产生 ,请 求 CPU 进行 处 理 。 这 是 通过 一 个 事件 消息 
报告 给 CPU 的 。 报 告 的 方式 可 以 是 主动 的 ,也 可 以 是 被 动 的 。 

第 二 :真实 传递 数据 。 

先 看 一 下 数据 状态 被 动 报告 的 情形 ， 

要 完成 这 些 状 态 的 报告 以 及 数据 的 输入 这 2 件 事情 ,设备 需要 有 2 个 窗口 ,或 叫 端口 ,来 
与 CPU 传达 信息 。 在 硬件 系统 中 ,端口 的 访问 是 通过 IO 地 址 来 操作 的 。 相 对 于 所 举 的 例 
子 , 一 个 输入 设备 需要 有 一 个 状态 端口 ,以 及 一 个 数据 端口 。 通 过 状态 端口 ,CPU 可 以 查询 到 
数据 准备 状态 ,通过 数据 端口 ,CPU 可 以 读 取 数据 。 

对 于 主动 报告 事件 的 输入 设备 ,设备 还 需要 有 一 个 中 断 请 求 线 连接 到 CPU ,通过 中 断 , 一 
个 外 部 设备 可 以 实时 中 断 CPU 当前 的 操作 ,主动 报告 一 个 外 部 事件 已 经 产生 ,等 待 CPU 进 
行 处 理 。 

对 于 大 批量 的 数据 传输 , 单 靠 一 个 数据 端口 来 读 取 数 据 是 不 够 用 的 ,因为 那样 很 浪费 
CPU 处 理 器 的 时 间 。 原 因 是 CPU 处 理 器 的 速度 通常 都 很 高 ,而 外 部 设备 的 工作 速度 与 CPU 
的 工作 速度 比 起 来 ,要 低 好 几 个 数量 级 ,速度 的 不 匹配 导致 CPU 的 时 间 浪 费 。 所 以 对 于 批量 
数据 的 读 取 ,往往 由 一 个 单独 的 设备 来 专门 负责 ,把 数据 从 一 个 外 部 设备 搬运 到 系统 内 存 的 特 
定位 置 ,搬运 完 之 后 ,再 通知 CPU ,数据 已 经 搬运 到 “大 楼 内部。 由 此 可 以 想见 ,与 CPU 协同 
工作 的 系统 内 存 必 须要 工作 得 很 快 ,否则 同样 会 遇 到 速度 不 匹配 而 导致 CPU 的 时 间 浪 费 。 
现在 有 很 多 的 特殊 机 制 解决 CPU 与 内 存 之 间 速 度 不 匹配 的 改进 方法 ,大 家 熟知 的 cache 就 是 
其 中 之 一 。 

这 个 专门 负责 搬运 的 设备 就 是 DMA ,直接 内 存 存 取 。 

2. 接收 数据 

接收 数据 的 设备 ,比如 :显示 设备 ,打印 机 设备 和 声音 播放 设备 ,与 产生 数据 的 设备 相对 ， 
接收 数据 的 设备 从 CPU 那里 接收 数据 。 


第 3 章 ， 硬 件 基础 


与 产生 数据 的 设备 相似 ,可 以 想象 接收 数据 的 设备 也 需要 两 个 端口 : 

第 一 是 状态 端口 ,第 二 是 数据 端口 。 

产生 数据 的 设备 所 要 报告 的 状态 是 数据 已 经 产生 ,那么 接收 数据 的 设备 所 要 报告 的 状态 
是 端口 已 经 准备 好 接收 新 的 数据 。 当 CPU 向 一 个 设备 输送 一 个 或 一 批 数 据 之 后 , 慢 速 的 外 
部 设备 需要 -- 段 时 间 来 处 理 这 些 数据 , 当 这 批 数据 处 理 完 之 后 ,通过 状态 端口 可 以 通知 CPU， 
下 一 个 或 一 批 数据 可 以 再 次 传递 过 来 。 

对 于 一 批 数据 的 情形 ,可 以 想象 在 这 个 设备 内 有 一 个 缓冲 区 。 缓冲 区 的 深度 就 是 一 次 可 
以 接收 CPU 传递 过 来 数据 的 最 大 长 度 。 

为 了 管理 这 个 缓冲 区 ,需要 有 一 个 缓冲 区 的 起 始 端口 地 址 (IO 地 址 ) ,缓冲 区 的 大 小 指示 
(通过 一 个 寄存 器 或 是 通过 文档 说 明 ) ,以 及 当前 操作 位 置 的 指针 。 

与 产生 数据 的 设备 相似 ,接收 数据 的 设备 也 可 以 有 主动 报告 和 被 动 报告 的 机 制 , 以 及 使 用 
DMA 辅助 传送 数据 ,只 不 过 方向 刚好 相反 而 已 。” 

3. 处 理 数 据 

无 论 是 输入 设备 ,还 是 输出 设备 ,它们 都 需要 对 数据 进行 处 理 。 就 像 编写 一 个 模块 函数 一 
样 , 在 这 个 函数 内 部 必定 会 对 数据 做 一 些 处 理 。 当 然 并 不 是 所 有 的 函数 都 一 定 要 有 数据 输入 ， 
一 定 要 有 数据 输出 ,或 是 一 定 要 有 数据 处 理 。 

数据 处 理 的 过 程 一 般 是 设备 自身 完成 的 ,为 了 增加 灵活 性 和 控制 性 ,在 数据 处 理 的 过 程 中 ， 
有 时 还 需要 CPU 进行 适当 的 干预 ,也 就 是 说 需要 CPU 发 送 各 种 数据 操作 的 指令 。 这 就 跟 编 写 
驱动 时 所 设计 的 IOCTL() 函数 一 样 ,上 层 应 用 发 出 各 种 命令 请 求 , 下 层 驱 动 执行 对 应 的 操作 。 对 
于 设备 也 一 样 ,由 CPU( 通 常 是 驱动 ) 向 一 个 设备 发 送 操作 请 求 , 设 备 执行 相应 的 操作 。 

CPU 向 设备 发 送 命令 请 求 是 通过 一 些 命令 端口 来 操纵 的 。 当 一 条 命令 执行 完毕 ,设备 可 
以 向 CPU 报告 一 个 执行 状态 (比如 说 ,正确 传输 ,或 是 一 个 错误 产生 )。 所 以 数据 的 处 理 同 样 
也 有 状态 寄存 器 。 状 态 的 报告 也 可 以 是 主动 的 ,或 是 被 动 的 。 

由 于 命令 字 的 发 送 涉及 到 的 信息 量 不 大 ,命令 字 的 传达 一 般 不 需要 通过 DMA。 

小 结 ; 

本 节 只 是 从 数据 传递 这 一 特性 来 说 明 设 备 的 操作 ,实际 情况 中 ,设备 的 控制 是 非常 复杂 
.的 。 每 一 个 设备 都 涉及 相关 的 一 些 总 线 协议 ,以 及 一 个 设备 自身 的 数据 处 理 的 一 些 规范 。 一 
个 设备 含有 许多 操作 ,一 组 操作 完成 一 个 特定 的 功能 。 软 件 对 于 设备 的 操作 是 通过 对 IO 地 
址 的 访问 来 实现 的 。 所 以 除了 要 理解 数据 传递 ,还 要 理解 设备 的 各 种 功能 ,以 及 对 应 于 这 些 功 
能 的 操作 方式 .状态 查询 和 结果 验证 等 。 


3.3.5 一 个 IDE 控制 器 设备 实例 


下 面 以 一 个 实际 的 例子 来 说 明 一 个 设备 的 功能 及 其 操作 。 这 个 例子 以 ITE8172 中 的 硬 
盘 控 制 器 为 例 来 说 明 如 何 从 软件 开发 的 角度 来 认识 一 个 设备 ,以 及 如 何 从 软件 实现 的 角度 去 
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控制 一 个 设备 。 

1. 概 述 

ITE8172 的 IDE 控制 器 (以 下 简称 IDE 控制 器 ) 提 供 一 个 从 IDE 设备 到 系统 的 一 个 接口 ， 
这 个 接口 遵循 ATA/ATAPI 一 4 标准 (编者 注 :为 此 读者 需要 基本 了 解 ATA/ATAPI 协议 标 
准 )。IDE 控制 器 还 支持 分 散 / 集 中 DMA 机 制 (Scatter/Gather DMA Mechanism) 。 

2. 结构 框图 

IDE 控制 器 作为 一 个 PCI 设 备 挂 在 PCI 总线 上 。 由 图 3 -9 上 可 以 看 出 ,IDE 控制 器 既是 

一 个 主 设备 ,又 是 一 个 从 设备 ;作为 主 设备 , 它 可 以 发 起 一 系列 的 总 线 传 输 ;作为 从 设备 , 它 可 

以 响应 PCI 总 线 上 的 数据 命令 请 求 。 


ATA/ATAPI 设备 0## ATA/ATAPI 设备 1# 


图 3-9 ITE8172 IDE 控制 器 框图 : 


3. IDE 控制 器 寄存 器 组 加 
IDE 控制 器 支持 标准 的 PCI 配置 寄存 器 。 除 此 之 外 ,由 于 IDE 控制 器 支持 PCI 主 设备 ， 
所 以 它 还 有 一 组 总 线 主 设备 IDE 输入 /输出 寄存 器 (Bus Master IDE IVO Registers) 。 
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表 3-23 列 出 了 ITE8172 的 IDE 控制 器 的 PCI 配 置 寄存 器 , 表 3-24 列 出 了 总 线 主 设备 所 
IDE 输入 /输出 寄存 器 。 入 
表 3-23 ITE8172 IDE 控制 器 的 PCI 配置 寄存 器 软 


寄存 器 名 字 
制造 商标 识 寄存 器 (VID) 


设备 标识 寄存 器 (DID) 


到 
0x00 1283h 计 


5 
0x02 8172h 巡 
命令 寄存 器 (CMD) 


后 

0x04 0005h 机 

想 

设备 状态 寄存 器 (STS) 0x06 0280h 与 


一 
[7 
[9 
攻 
[0 
[0 


ol1h 
编程 接口 寄存 器 (PI) 区 SA 法 


主 设备 类 代码 (BCC) 


头 部 类 型 寄存 器 (HTYPE) 
基地 址 寄存 器 0(BA0) 
基地 址 寄存 器 1(BA1) 


0x0B 01h 
0xE 00h 


140179F1h 


14017BF5h 


从 IDE 时 钟 寄存 器 (SLVT) 
同步 DMA 控制 寄存 器 (SDMAC) 


表 3-24 ITE8172 IDE 总 线 主 设备 IDE 输入 /输出 寄存 器 


总 线 主 设备 IDE 命令 寄存 器 (BMICR) RO lssh | 
| 
Fo | 


令 1283h 
总 线 主 设备 IDE 状态 寄存 器 (BMISR) 
线 主 省 


总 线 主 设备 基地 址 寄存 器 (BMBA) 


IDE 时 钟 寄 存 器 (IDET) 


读 / 写 
RO 
RO 
RO 
RO 
有 了/ 允 
及 / 允 
R/W 
R/ 了 
有 R/ 
有 /了 
R/ 


oo 
[7 
总 线 主 设备 IDE 描述 表 指针 寄存 器 (BMIDTPR) oo | 


4. IDE 输入 /输出 端口 的 映射 


在 PC 机 里 ,大 家 熟知 的 IDE 控制 寄存 器 有 2 组 寄存 器 :命令 寄存 器 和 控制 寄存 器 。 命 令 
寄存 器 用 来 接收 命令 和 传送 数据 ;控制 寄存 器 用 作 磁 盘 控 制 。 其 中 命令 控制 器 的 地 址 范围 是 
1FOH 一 1F7H ,控制 寄存 器 的 地 址 范围 是 3FOH 一 3F7 五 。 一 般 PC 机 里 有 两 个 IDE 接口 ,对 于 
第 二 组 接口 ,这 两 组 寄存 器 的 地 址 分 别 是 : 

- 国 命令 寄存 器 170H 一 177H; 
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氢 国 控制 寄存 器 ”370H 一 377H。 

入 在 屿 入 趟 设备 里 ,由 于 采用 PCI 总线 结构 ,IDE 控制 器 是 挂 在 PCI 总 线 上 的 ,所 以 这 里 的 
人 基地 址 与 PC 机 里 分 配 的 地 址 不 同 ,而 且 它 们 的 基地 址 是 通过 PCI 动态 分 配 , 可 以 动态 配置 
件 | “的 ,当然 也 可 以 采用 默认 值 。 在 默认 情况 下 ,如 表 3 - 25 所 列 ( 如 果 基地 址 不 同 ,只 要 加 上 对 应 
没 | 的 偏 移 就 可 以 了 ) 。 

这 表 3-25 IDE 命令 寄存 器 


二 
Ah 
想 过 存 器 宽度 |。 存 取 宽 度 
与 本 于 到 
一 由 
四 一 

本 和 王 二 妆 于 和 ， 
了 120 


0x1l40179F3 8 位 
[2 司 

0xli40179F4 
LBAL[15 : 8] 1 ，LBa[l5:9] | 8] 


柱 面 号 (高 ) 柱 面 号 (高 ) 
Oxl40179F5 


驱动 器 /磁头 选择 Fa 
0x1l40179F6 8 位 
LBA[27 : 24] | LBA[27 : 24] 


关于 IDE 命令 及 操作 这 里 不 再 歼 述 ,有 兴趣 深入 了 解 的 读者 可 以 参阅 相关 接口 介绍 方面 
的 书籍 。 


和 Workshop 
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第 二 篇 “驱动 模型 篇 


在 本 篇 中 ,首先 从 驱动 的 开发 开始 讨论 。 作 为 一 个 独立 设备 的 驱动 ,从 硬件 上 来 讲 , 它 是 
一 个 完整 、 复 杂 的 硬件 平台 中 相对 独立 的 一 个 组 件 ; 从 软件 上 来 说 , 它 也 是 一 个 复杂 系统 中 的 
一 个 单一 部 分 。 因 此 首先 讨论 设备 驱动 的 开发 有 助 于 读者 更 容易 进入 系统 程序 的 开发 ,对 工 
程 设计 也 非常 实用 。 因 为 在 很 多 情况 下 ,对 于 系统 平台 软件 ,我 们 只 负责 一 些 移植 工作 ,只 负 
责 一 些 驱 动 模块 的 开发 ,而 不 是 从 头 到 尾 构建 一 个 完整 的 系统 。 


同时 ,有 了 驱动 开发 的 经 验 ,也 很 容易 理解 一 个 复杂 系统 的 开发 。 
“驱动 的 通用 模型 


本 章 将 向 读者 讲解 关于 驱动 的 一 般 共 性 ,让 读者 初步 了 解 设备 驱动 的 架构 。 对 于 各 种 各 
样 的 内 入 式 操作 系统 , 面 对 名 目 人 繁多 的 接口 函数 ,究竟 哪个 函数 将 起 到 什么 作用 ? 哪 一 个 函数 
里 面 将 实现 什么 样 的 特定 操作 ? 本 章 将 向 读者 解答 这 些 问题 。 

”随后 的 章节 针对 一 些 具体 操作 系统 中 的 驱动 接口 实例 来 帮助 读者 进一步 分 析 各 个 操作 系 
统 中 驱动 程序 的 框架 ,从 而 深入 掌握 IO 接口 系统 .驱动 接口 以 及 软件 、 硬 件 之 间 的 交互 。 


0 
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简单 地 说 ,设备 驱动 程序 在 软件 系统 中 的 重要 作用 有 两 个 方面 : 
名 为 应 用 程序 提供 统一 的 文件 访问 接口 ; 
凶 屏蔽 硬件 实现 细节 。 
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系统 审 有 种 类 繁多 的 外 围 设 备 ,通过 操作 系统 的 文件 系统 ,IO 系统 ,有 了 设备 驱动 程序 
的 实现 ,使 得 应 用 程序 对 于 各 种 各 样 设 备 的 操作 可 以 直接 跟 文 件 系统 打交道 ,通过 系统 中 对 于 
设备 的 命名 规则 来 打开 特定 的 硬件 设备 ,而 以 统一 的 读 、 写 方式 来 实现 对 设备 的 “ 存 取 ”。 与 此 
同时 ,作为 应 用 程序 来 说 ,它们 不 必 关 心 硬件 的 实现 细节 ,可 以 以 一 类 设备 统一 的 操作 方式 来 
实现 对 设备 的 操作 。 比 如 说 ,一 个 声卡 ,可 能 是 由 不 同 厂商 设计 的 ,作为 应 用 程序 而 言 , 它 们 要 
做 的 工作 ,是 打开 系统 中 默认 的 .或 特定 的 音频 设备 ,然后 通过 读 写 例 程 ,把 PCM 数据 写 和 人 到 
声卡 设备 ,设备 由 驱动 的 配合 来 实现 回放 。 必 要 的 时 候 , 可 能 还 会 通过 声卡 所 提供 的 接口 进行 
适当 的 配置 , 例如 :对 声 道 的 数目 ( 单 声 道 , 双 声 道 ) ,数据 采样 率 (22. 05 kHz, 44. 1 kHz， 
48 kHz) ,音量 的 大 小 ,左右 声 道 的 平衡 等 。 这 些 配 置 可 以 采用 ioctl() , 辅 以 适当 的 命令 字 以 
及 参数 实现 对 设备 的 配置 。 

在 一 个 系统 中 ,常见 的 外 部 设备 有 以 下 几 种 ， 

@ 人 机 输入 /输出 设备 ”键盘 ,显示 设备 ,打印 机 和 扫描 仪 。 

@ 定点 设备 (也 属于 人 机 输入 设备 ) ”鼠标 和 触摸 屏 。 

音频 输入 /输出 设备 “MIC 话 简 、 声 卡 及 扬声器 。 

图 视频 输入 /输出 设备 ”摄像 头 .电视 信 号 输入 /输出 。 

@@ 存储 设备 “Flash 闪存 .CF 卡 .SD 卡 .MMC 卡 .IDE 硬盘 和 CD/DVD 光驱 。 

国 互联 设备 “UART、 红 外 (IrDA) .蓝牙 (BlueTooth) ,WiFi,GSM/2G/3G 和 Ethernet。 

G@) 总 线 设 备 “USB,1394,PCI,SDIO,PCMCIA,SPIE 和 了 EC 等 。 

除了 上 述 列 举 的 这 些 外 围 设备 之 外 ,现代 的 SoC 里 还 集成 了 音频 .视频 的 压缩 编码 ,解码 
的 模块 ,它们 也 需要 驱动 去 与 底层 的 硬件 进行 交互 。 

除了 上 面 提 到 的 设备 类 之 外 ,全 世界 有 无 数 家 硬件 设备 制造 商 , 即 使 提供 同一 类 设备 , 它 
们 的 硬件 实现 也 往往 千差万别 ,即使 同一 家 厂商 开发 同一 类 设备 ,它们 也 会 更 新 换代 ,增加 新 
的 功能 ,升级 版 本 ,产品 系列 的 差别 也 很 大 。 所 以 如 果 没 有 驱动 程序 ,通过 应 用 程序 直接 访问 
硬件 的 话 , 其 工作 量 将 相当 巨大 ,维护 起 来 也 非常 困难 。 随 着 系统 复杂 度 的 增加 ,更 新 换代 的 
需求 越 来 越 多 ,没有 驱动 程序 来 实现 单一 的 系统 已 经 不 再 可 能 。 驱 动 程序 正 是 应 运 这 一 需求 
而 产生 的 。 

同时 ,驱动 程序 也 是 软件 分 层 的 产物 。 它 使 得 硬件 设备 的 驱动 程序 设计 者 ,专注 于 与 硬件 
的 交互 ,掌握 和 控制 硬件 的 状态 .行为 ,完成 应 用 程序 与 外 部 设备 的 数据 交互 与 转换 。 同 时 , 它 
按照 系统 的 要 求 规范 , 即 按照 设备 类 型 的 文件 接口 ,提供 统一 的 应 用 编程 接口 (文件 操作 接 
口 ) ,使 得 用 户 程序 可 以 像 读 写 普 通 文件 那样 来 打开 一 个 设备 (“ 文 件 ”) ,进一步 进行 参数 的 设 
置 ( 对 设备 进行 配置 ) ,以 及 “ 读 ? 或 “ 写 ” 的 操作 ,最 后 关闭 这 个 设备 (“ 文 件 ”) 。 

因此 ,有 了 驱动 程序 ,对 于 应 用 程序 设计 者 来 说 ,就 只 需要 专注 于 各 种 复杂 应 用 的 实现 ,而 
不 必 关 心 所 采用 的 硬件 设备 来 自 哪 一 家 厂商 ,也 不 必 关心 硬件 的 实现 原理 和 细节 ,只 需要 了 解 
其 根本 功能 特性 ,以 及 操作 这 类 设备 时 由 操作 系统 提供 的 统一 的 文件 操作 接口 就 可 以 了 。 
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在 上 面 ,反复 提 到 “类 设备 ”。 这 里 的 类 设备 与 USB 里 定义 的 类 设备 的 概念 略 有 不 同 ,是 
指 一 类 设备 。 一 类 设备 可 以 用 同一 个 驱动 来 操作 ,也 可 以 用 不 同 的 驱动 来 操作 。 对 于 各 种 设 
备 驱 动 , 根 据 它 们 的 操作 特征 ,以 及 应 用 编程 接口 的 差别 ,可 以 对 其 大 致 归 类 , 称 之 为 驱动 类 
型 ,对 于 特性 相似 的 一 类 ,或 几 类 设备 所 采用 的 统一 的 应 用 编程 接口 归 为 一 类 。 下 面 解释 一 下 
为 什么 要 提出 驱动 类 型 这 个 概念 。 

上 面 列 出 了 常见 的 大 部 分 设备 ,也 提 到 驱动 程序 为 应 用 程序 提供 统一 的 接口 。 但 是 由 于 
各 种 类 型 的 设备 所 提供 的 功能 千差万别 ,有 的 简单 ` 有 的 复杂 ,其 操作 方式 也 完全 不 相同 ,有 些 
是 一 个 系统 必须 的 ,有 些 却 是 可 选 的 动态 加 载 的 ,所 以 驱动 程序 为 应 用 程序 提供 统一 的 接口 
也 有 好 几 类 。 即 使 通过 层 层 封装 ,实现 完全 一 样 的 Open,Close, Read, Write, Ioctl 接口 ,对 于 
某 些 设 备 也 将 会 影响 其 效率 ,所 以 是 完全 没有 必要 的 。 例 如 :对 于 输入 设备 ,由 于 用 户 的 输入 
对 于 系统 来 说 是 随机 的 ,如 果 采 用 主动 读 的 方法 获取 用 户 的 输入 ,在 很 多 时 候 会 读 人 失败 。 对 
于 这 种 情况 ,采用 消息 驱动 的 机 制 就 比较 有 效 ,与 主机 主动 读 输入 的 方式 相反 ,消息 驱动 的 方 
式 是 当 输 入 设备 有 输入 动作 (事件 ?的 时 候 , 由 设备 主动 向 系统 发 送 消息 。 系 统 被 动 接 受 消 息 ， 
然后 对 消息 采取 响应 , 当 没 有 消息 的 时 候 , 接 受 事件 消息 的 任务 就 处 于 挂 起 状态 。 由 此 看 来 ， 
并 非 所 有 的 设备 都 是 通过 Open ,Close,Read, Write 来 访问 。 

那么 如 何 兼顾 统一 ,又 照顾 差别 呢 ? 最 好 的 办 法 就 是 对 于 一 类 设备 ,或 者 特性 相近 的 几 类 
设备 采取 同样 的 接口 。 

历史 上 ,主流 的 操作 系统 都 分 了 几 大 类 型 的 设备 驱动 。 下 面 就 个 人 的 理解 分 别 进行 阐述 ， 
以 便于 读者 的 理解 。 


4.2.1 Linux 中 的 驱动 类 型 


在 Linux 中 ,主要 有 4 种 类 型 的 设备 驱动 :字符 型 设备 驱动 . 块 设备 驱动 .网 络 设备 驱动 和 
总 线 设 备 驱动 。 

字符 型 设备 和 块 设备 都 是 通过 文件 打开 的 形式 来 操作 的 。 在 Linux 系统 中 的 /dev/ 目 录 
下 ,为 每 个 字符 型 设备 和 块 设 备 创 建 了 一 个 设备 文件 。 这 些 设备 文件 就 是 应 用 程序 访问 一 个 
设备 的 人 口 。 这 些 设备 文件 并 不 对 应 到 外 部 的 真实 物理 设备 ,它们 只 是 物理 设备 的 驱动 程序 
所 配置 数据 的 记录 。 这 些 设备 文件 中 记录 了 分 配给 物理 设备 的 逻辑 上 的 主 设备 号 和 从 设备 
号 。 驱 动 程序 在 加 载 时 ,会 向 系统 注册 说 明 该 驱动 支持 某 类 设备 ( 主 设备 号 .从 设备 号 等 于 自 
已 注册 时 登记 的 主 设备 号 和 从 设备 号 的 那 一 类 ) 的 驱动 操作 。 由 此 看 来 ,/dev/ 目 录 下 的 设备 
文件 是 应 用 程序 访问 驱动 程序 的 一 个 人 口 点 ,通过 这 个 访问 点 ,应 用 程序 调用 操作 系统 提供 的 
统一 接口 open( 例 如 :open(“/dev/UART02”)) 来 打开 各 个 物理 设备 ,而 不 需要 采用 互 不 相同 
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的 调用 函数 名 字 ,例如 :UART0_open,UART1_open, Audio__open,Flash1_open,hda_open， 
hdb_pen 等 。Linux 通过 设备 文件 来 实现 从 一 个 设备 名 字 到 访问 特定 的 驱动 程序 之 间 的 
关联 。 

下 面 简单 说 明 一 下 几 种 类 型 设备 的 区 别 。 

字符 型 设备 主要 是 顺序 操作 的 , 它 没 有 缓冲 区 ,不 能 随机 移动 文件 读 写 指针 。 例 如 :键盘 
和 串口 (UART) 的 驱动 属于 字符 型 设备 。 

块 设备 与 字符 型 设备 相对 ,每 次 读 写 数据 以 块 为 单位 , 它 有 读 写 缓冲 区 ,可 以 随机 移动 读 
写 指针 。 例 如 :Flash,IDE 硬盘 就 属于 块 设 备 。 

除了 上 述 两 类 设备 ,还 有 一 类 网 络 设备 。 为 什么 单列 一 类 网 络 设 备 呢 ? 其 主要 原因 是 因 
为 网 络 上 的 数据 访问 与 本 地 数据 访问 不 一 样 ,由 于 网 络 连 通 的 复杂 性 ,采用 数据 包 的 方式 进行 
数据 传输 ,出 现 丢 包 、 重 复 包 .损坏 包 和 延 时 等 诸多 不 确定 因素 ,所 以 网 络 上 的 数据 传输 需要 有 
多 层 协 议 的 支持 。 为 了 访问 网 络 数据 ,操作 系统 定义 了 一 套 与 一 般 文 件 操 作 不 一 样 的 应 用 接 
口 ,广泛 使 用 的 是 Socket。Socket 通过 一 系列 连接 原 语 与 远 端 主机 建立 连接 ,包括 一 系列 的 
请 求 ,等待 .监听 和 响应 等 所 起 的 作用 与 本 地 文件 操作 的 Open 很 类 似 。 一 旦 连接 建立 起 来 ， 
随后 的 数据 读 写 操作 也 与 本 地 文件 操作 很 类 似 , 但 是 等 待 ,阻塞 .超时 和 连接 丢失 等 一 系列 潜 
在 的 不 确定 因素 导致 网 络 的 访问 与 本 地 文件 的 访问 仍然 差别 很 大 。 由 于 远程 访问 与 本 地 数据 
访问 的 显著 差别 ,于 是 把 网 络 设备 独 列 出 -一 类 ,定义 不 同 的 应 用 编程 接口 。 

最 后 一 类 是 总 线 设 备 , 总 线 设 备 本 身 不 完成 用 户 直接 需要 的 特定 功能 ,也 就 是 说 ,总 线 设 
备 不 向 应 用 程序 提供 应 用 编程 接口 (API) ,也 不 最 终 产生 和 处 理 用 户 数据 , 它 的 主要 作用 是 为 
总 线 上 的 设备 提供 传输 和 控制 通道 。 总 线 设备 的 驱动 则 为 类 设备 驱动 程序 ( 即 客户 驱动 程序 ) 
提供 服务 , 它 通 过 设备 驱动 编程 接口 DDI(Device Driver Interfaces) 为 上 层 的 软件 (客户 驱动 
程序 ) 提 供 服务。 

总 线 设 备 驱动 的 另 一 个 作用 是 支持 动态 配置 。 通 过 动态 配置 ,总 线 可 以 动态 地 监测 总 线 
上 是 否 有 一 个 或 多 个 设备 连接 上 ( 播 入 ?或 断 开 ( 拔 出 )。 一 旦 检测 到 新 的 设备 连接 到 系统 ,总 
线 驱 动 会 通过 标准 的 总 线 数据 问 询 协 议 来 识别 这 个 设备 的 类 型 ,然后 初始 化 这 个 设备 ,如 : 复 
位 .上 电 、 分 配 资源 .中 断 分 配 和 DMA 通道 分 配 等 。 如 果 该 设备 的 资源 需求 ,例如 :供电 需求 ， 
系统 无 法 满足 , 则 总 线 驱 动 拒绝 加 载 这 个 设备 。 如 果 设 备 可 以 正常 被 加 载 , 则 总 线 驱 动 加载 相 
应 类 设备 的 客户 驱动 ,由 它 负责 对 该 类 设备 的 后 续 初 始 化 以 及 随后 的 数据 交互 操作 。 这 一 系 
列 动态 监 测 .特性 查询 上 电 初 始 .设备 配 置 、. 加 载 类 设备 所 需要 的 驱动 ,以 及 进行 软件 初始 化 
的 过 程 称 为 总 线 枚 举 过 程 。 

与 之 相对 ,如 果 一 个 设备 从 总 线 拔 出 , 则 总 线 将 监测 到 设备 端口 的 变化 ,于 是 从 系统 中 御 
载 与 这 个 类 设备 相关 的 驱动 ,以 及 回收 这 个 设备 所 占用 的 资源 ,例如 :访问 地 址 IO 地 址 空间 、 
中 断 和 DMA 等 ,以 备 其 他 的 设备 加 载 时 分 配 使 用 的 资源 。 

由 此 看 来 ,总 线 设 备 可 以 支持 动态 加 载 或 卸载 一 个 设备 以 及 与 设备 相关 的 驱动 ,后 者 常 称 
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为 客户 驱动 。 这 种 功能 , 常 称 为 “ 即 插 即 用 ”"(P&P 或 PnP) 功 能 。 

总 线 上 的 设备 常 称 为 类 设备 , 它 表 示 一 个 类 型 的 设备 ;而 类 设备 的 驱动 常 叫做 客户 驱动 。 
例如 在 USB 驱动 层次 中 ,USB 总 线 驱 动 为 USB 总 线 上 的 设备 提供 数据 传输 的 软件 服务 ; 诸 
如 USB 人 机 接口 类 设备 (HID) ,或 是 一 个 USB 存储 设备 ,或 是 其 他 USB 设备 会 有 各 自 特定 
的 客户 驱动 ,它们 借助 于 USB 总 线 驱 动 所 提供 的 服务 来 实现 客户 驱动 与 USB 设备 之 间 的 各 
种 数据 包 的 传输 。 

类 设备 驱动 ,依赖 于 总 线 所 提供 的 硬件 接口 ,以 及 总 线 驱 动 所 提供 的 软件 服务 来 实现 类 设 
备 驱 动 与 类 设备 硬件 之 间 的 交互 功能 。 在 面向 应 用 的 编程 接口 方面 ,类 设备 驱动 可 能 实现 像 
字符 型 设备 那样 的 应 用 接口 ,或 是 像 块 设备 那 块 的 应 用 接口 。 例 如 :一 个 USB 键盘 可 能 就 实 
现 像 字 符 型 设备 那样 的 应 用 接口 ,而 一 个 USB 存储 设备 地 却 可 以 实现 像 Flash 或 是 IDE 硬盘 
那样 的 块 设备 接口 。 从 应 用 编程 接口 上 来 看 ,访问 总 线 上 的 设备 跟 访 问 直 接 与 系统 内 部 总 线 
相连 的 设备 没有 什么 区 别 , 因 此 类 设备 驱动 没有 单列 一 种 驱动 类 型 。 


4.2.2 WinCE 中 的 驱动 类 型 


WinCE 中 设备 驱动 的 类 型 与 Linux 很 类 似 。 只 不 过 在 WinCE 中 , 提出 了 一 个 “本 地 
驱动 ?。 

所 谓 本 地 驱动 ,就 是 那些 不 用 文件 接口 来 操作 的 驱动 ,例如 :鼠标 ,键盘 和 显示 器 。 由 于 
Windows 操作 系统 提供 便捷 的 窗口 机 制 , 它 以 图 形 界 面 下 的 消息 驱动 为 框架 。 键 盘 、 鼠 标 或 
其 他 定位 点 的 事件 输入 ,直接 以 消息 的 方式 发 送 到 特定 的 消息 接收 窗口 ,而 不 是 采用 读 写 方式 
获取 输入 数据 。 同 样 ,对 于 输出 设备 显示 器 的 操作 是 对 窗口 所 在 的 显示 区 域 的 绘图 操作 来 实 
现 的 ,文字 及 图 形 的 输出 特定 于 一 个 窗口 ,这 种 窗口 机 制 有 助 于 “桌面 ?的 管理 ,各 个 窗口 管理 
自己 的 界面 显示 ,管理 自己 对 窗口 消息 的 响应 ,从 而 使 得 各 个 应 用 窗口 在 重 绘 . 琶 加 和 消息 管 
理 等 方面 操作 起 来 更 加 容易 。 窗 口 可 以 扩大 到 整个 屏幕 ,这 种 情况 下 ,一 个 应 用 可 以 独占 整个 
显示 区 ,拦截 所 有 的 输入 信息 。 对 于 屏幕 或 窗口 的 操作 , Windows 提供 了 标准 GDI 绘图 与 文 
字 输 出 本 数 ,用 户 编程 接口 也 不 用 采用 文件 打开 的 方式 ,而 是 通过 创建 设备 上 下 文 (graphics 
device context) 的 方式 来 管理 窗口 的 显示 区 。 在 WinCE 中 显示 驱动 也 属于 本 地 驱动 。 本 地 
驱动 一 般 是 在 操作 系统 启动 时 随 操作 系统 内 核 一 同 被 加 载 。 

字符 型 的 设备 ,被 称 之 为 流 式 (stream) 接 口 的 设备 。 流 式 接口 的 设备 驱动 由 设备 管理 器 
(device manager) 负 载 管 理 加 载 , 它 可 以 随 内 核 一 同 被 加 载 ,或 是 在 应 用 程序 请 求 需要 时 被 
加 载 。 

同样 地 ,WinCE 中 也 有 块 设备 ,总 线 设 备 和 网 络 设备 等 驱动 类 型 。 这 里 不 再 缆 述 。 


4.2.3 VxWorks 中 的 驱动 类 型 
VxWorks 的 I/O 系统 支持 以 下 几 种 类 型 的 设备 
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@ 字符 型 设备 。 例 如 :终端 (terminals) 或 通信 线 (communication lines) 。 
@ 随机 存 取 的 块 设备 。 例 如 :磁盘 (disk) 。 

@ 虚拟 设备 。 例 如 :任务 间 的 管道 (pipe) 或 套 接 字 (socket) 。 

@@ 监视 或 控制 的 MO 设备 。 例 如 :数字 或 模拟 的 IO 设备 。 

@ 访问 远程 设备 的 网 络 设 备 。 例 如 :以太 网 卡 。 


4.3 设备 驱动 的 通用 模型 


和 二 生生 和 全 的 计生 全 和 和 生生 和 生计 于 秆 生生 计生 


在 这 一 节 要 讨论 各 种 散人 式 操 作 系 统 中 设备 驱动 的 通用 概念 ,以 及 开发 设备 驱动 通用 的 
内 容 与 一 般 的 方法 。 、 

无 论 是 Linux, WinCE 还 是 VxWorks, 作 为 设备 驱动 ,它们 所 要 解决 的 问题 都 是 基本 相同 
的 ,所 以 其 驱动 的 结构 也 大 同 小 异 。 通 过 本 节 的 分 析 , 可 以 使 我 们 对 驱动 程序 内 部 的 实现 结构 
有 一 个 清楚 的 认识 。 


4.3.1 模块 部 分 的 驱动 


一 个 驱动 程序 从 功能 上 可 以 分 成 两 大 部 分 ,一 部 分 称 为 模块 的 初始 化 , 另 一 部 分 才 是 真正 
的 对 设备 进行 操作 的 驱动 。 后 者 将 在 下 一 小 节 讨 论 。 

模块 的 初始 化 也 可 以 说 是 模块 部 分 的 驱动 。 为 什么 要 提出 一 个 模块 的 驱动 呢 ? 因为 作为 
一 个 驱动 程序 , 它 在 系统 中 是 一 个 组 件 部 分 。 作 为 一 个 独立 的 实体 , 它 要 与 操作 系统 的 其 他 部 
分 相互 关联 。 试 想 ,一 个 设备 驱动 只 是 实现 了 read, write 和 ioctl 这 些 函 数 ,那么 一 个 系统 中 
有 很 多 的 设备 ,也 有 很 多 的 设备 驱动 ,一 个 应 用 如 何 知道 想 要 调用 的 设备 应 该 调 到 那个 read 
函数 呢 ? 操作 系统 也 不 知道 ,而 且 如 果 整 个 操作 系统 作为 一 个 巨大 进程 来 运行 的 话 ,两 个 以 上 
的 read 会 导致 同名 而 无 法 被 正确 连接 ,也 就 无 法 被 正确 运行 。 也 许 读 者 要 说 ,实现 了 open， 
close 函数 ,通过 它 就 可 以 找到 特定 的 调用 关系 。 但 问题 还 是 和 上 面 的 讨论 一 样 ,操作 系统 不 
知道 调用 哪个 open, 也 不 允许 多 个 同名 的 全 局 函数 。 

问题 如 何 解决 呢 ? 不 同 的 驱动 需要 不 同 的 区 分 ,命名 空间 可 以 解决 这 个 问题 。 而 模块 的 
驱动 就 是 为 了 解决 这 些 重 名 和 定位 的 问题 。 也 就 是 说 ,一 个 设备 的 驱动 实现 了 一 些 核心 的 读 、 
写 和 控制 的 例 程 。 而 这 个 设备 驱动 作为 一 个 独立 的 模块 ,还 需要 一 个 包装 ,对 于 这 个 包装 , 需 
要 在 它 上 面 作 上 适应 的 标记 ,同时 还 要 在 系统 中 注册 登记 。 

明白 了 这 个 道理 ,就 很 容易 理解 一 个 驱动 内 部 的 层次 结构 了 。 也 就 是 说 ,在 一 个 驱动 程序 
的 设计 中 ,除了 要 实现 那些 基本 的 读 、 写 和 控制 操作 的 例 程 之 外 ,还 得 在 驱动 程序 的 实现 里 增 
加 额外 的 辅助 功能 ,以 帮助 操作 系统 正确 加 载 这 个 驱动 ,正确 地 在 系统 中 登记 注册 ,正确 地 把 
一 个 应 用 程序 对 某 个 设备 的 请 求 定位 到 对 于 这 个 驱动 的 请 求 上 ,实现 名 字 到 驱动 的 关联 。 

下 面 来 看 一 下 ,作为 一 个 模块 的 驱动 , 它 要 做 哪些 实现 事情 。 
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在 Linux 里 ,有 两 个 人 口 负责 模 块 的 驱动 ,它们 是 ， 


_init in 让 module( ); 


_init release_module( ); 


从 名 字 上 显而易见 ,第 一 个 函数 是 模块 的 初始 化 函数 , 它 是 模块 在 被 加 载 时 需要 运行 的 画 
数 。 而 第 二 个 函数 则 是 模块 被 印 载 时 需要 调用 的 清理 函数 。 

与 之 类 似 , WinCE 下 面 也 有 类 似 的 函数 DIMain。DllMain 与 其 他 线程 的 人 口 画 数 Main 
不 相同 ,这 里 DIMain 只 是 一 个 函数 , 它 与 普通 的 函数 没有 什么 两 样 ,但 是 在 一 个 驱动 被 加 载 、 
被 卸载 以 及 一 个 驱动 在 创建 一 个 新 的 线程 或 结束 一 个 线程 时 , DllMain 都 会 被 调用 到 。 所 以 
DllMain 提供 给 驱动 程序 员 更 多 ,更 灵活 的 控制 。 当 然 ,很 多 时 候 , 不 需要 做 那么 多 的 事情 ,这 
时 可 以 不 用 理会 这 些 调 用 。DllMain 通过 输入 参数 来 确定 调用 的 类 型 ,有 点 类 似 于 ioctl() 函 
数 ,根据 不 同 的 命令 来 完成 不 同 的 处 理工 作 。 

类 似 的 ,VxWorks 的 驱动 需要 实现 一 个 初始 化 函数 xxDrv( ); 该 函数 进行 驱动 的 初始 化 
加 载 工作 ,例如 注册 登记 一 个 驱动 ,连接 一 个 硬件 中 断 , 分 配 与 驱动 相关 的 数据 结构 等 。 

小 结 : 

一 个 模块 的 驱动 ， 就 是 要 把 一 个 驱动 加 载 到 系统 中 ， 在 这 个 过 程 中 ,一 般 需 要 向 系统 进行 

登记 注册 ,以 便 随后 对 该 驱动 所 管理 的 设备 的 访问 能 够 定位 到 这 个 驱动 ;然后 ,驱动 的 初始 化 
例 程 进行 整个 驱动 共有 的 初始 化 工作 ,也 就 是 那些 与 具体 的 设备 不 相关 、 全 局 的 .服务 于 所 有 
设备 共有 的 初始 化 工作 。 同 时 可 以 注意 到 ,一 个 驱动 程序 可 以 同时 支持 多 个 设备 实例 。 有 了 
这 些 概 念 , 在 遇 到 驱动 设计 中 的 那些 看 似 类似 又 有 所 不 同 的 函数 接口 时 ,我 们 就 会 在 设计 过 程 
中 区 别 对 待 ,在 合适 的 地 方 作 恰当 的 操作 。 

简单 地 ,从 外 部 功能 上 来 说 ,模块 的 驱动 为 应 用 程序 打开 一 个 类 型 的 设备 (同一 个 驱动 可 
能 支持 多 个 物理 设备 ,所 以 这 里 称 之 为 类 ) 提 供 了 软件 上 的 关联 ;从 内 部 功能 上 说 ,模块 的 驱动 
提供 设备 驱动 的 初始 化 工作 ,包括 :为 IO 系统 或 设备 管理 器 提供 登记 注册 信息 ,进行 该 设备 
共同 使 用 部 分 软件 的 初始 化 工作 。 


4.3.2 设备 的 驱动 例 程 


接 下 来 讨论 设备 操作 相关 的 驱动 。 

在 实际 对 设备 进行 数据 传输 的 操作 过 程 中 ,常常 涉及 一 些 系统 资源 ,例如 : 需要 硬件 中 断 
和 DMA 的 配合 ,物理 设备 需要 通过 IO 地 址 访问 ,为 此 需要 从 系统 内 存 里 分 配 一 块 专用 内 存 
空间 ,把 它 映 射 到 外 部 物理 设备 的 IO 地 址 空间 。 

除了 这 些 硬 件 资源 以 外 ,还 涉及 一 些 软件 资源 。 例 如 在 一 个 驱动 中 ,要 创建 一 些 全 局 的 数 
据 结构 ,创建 一 些 读 写 缓 冲 区 ,创建 数据 结构 的 链表 ,要 为 特定 的 设备 创建 私有 的 数据 结构 ,还 
可 能 创建 用 于 同步 或 互 斥 访问 的 锁 和 信号 量 等 。 如 果 一 个 驱动 涉及 大 量 数 据 或 事务 的 处 理 ， 
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则 耗 时 会 比较 多 ,还 可 能 需要 在 驱动 中 创建 一 些 内 核 线 程 ,由 它们 来 处 理 偶发 性 的 事务 。 

另外 ,一 些 读 写 请 求 可 能 需要 长 时 间 的 等 待 ,在 这 些 情 况 下 ,用 户 的 读 、 写 的 请 求 不 能 立即 
被 返回 ,这 时 需要 使 用 阻塞 等 待 的 机 制 。 

1. 设备 的 创建 

一 个 驱动 被 加 载 之 后 , 它 还 只 是 一 个 软件 的 概念 。 在 许多 情形 下 ,就 像 是 系统 加 载 了 一 个 
动态 库 。 这 个 驱动 还 没有 与 特定 的 设备 关联 起 来 。 也 就 是 说 ,模块 的 驱动 还 只 是 抽象 的 ,只 是 
对 设备 具体 操作 的 软件 部 分 的 一 个 载体 。 

在 用 户 开 始 使 用 一 个 设备 之 前 ,驱动 还 必须 在 软件 和 硬件 的 层面 上 创建 一 个 设备 。 系 统 
在 枚 举 过 程 中 , 当 找到 一 个 新 设备 时 ,IO 系统 或 设备 管理 器 就 试图 匹配 系统 中 已 经 加 载 的 模 
块 驱动 所 注册 的 设备 支持 类 型 ,然后 调用 该 驱动 程序 所 提供 的 设备 创建 函数 ,为 该 类 型 的 每 一 
个 设备 创建 一 个 设备 实例 。 只 有 在 这 个 过 程 之 后 ,用 户 程序 才 可 以 调用 Open 函数 来 打开 一 
个 物理 设备 。 也 就 是 说 ,如 果 系 统 仅仅 加 载 了 驱动 ,而 没有 创建 设备 ,用 户 是 无 法 打开 设备 的 。 
在 这 一 方面 ,实时 操作 系统 不 同 ,处 理 的 方式 也 略 有 不 同 。 

下 面 来 具体 讨论 一 下 ,各 个 嵌入 式 操作 系统 中 ,设备 的 创建 是 如 何 进行 的 。 

在 WinCE 中 ,设备 管理 器 (device manager) 首 先 加 载 了 驱动 ,这 个 时 候 , 它 要 使 用 参数 
DLL_PROCESS_ATTACH 来 调用 DiMain。 之 后 ,设备 管理 器 会 针对 系统 中 发 现 的 一 个 物 
理 设 备 来 尝试 调用 驱动 里 的 DEV_Init 例 程 , 如 果 成 功 , 则 以 后 会 用 此 设备 驱动 来 访问 这 个 物 
理 设备 。 另 一 个 函数 DEV_DeInit 例 程 做 相应 的 动作 。 这 些 函数 针对 每 一 个 实例 作 不 同 的 初 
始 化 和 清理 工作 。 

在 VxWorks 中 也 有 类 似 的 函数 。 

首先 

XxDrv( 》 
初始 化 驱动 ,然后 

XXxDevCreate (name,…) 
创建 一 个 设备 ,并 给 它 取 一 个 专 有 的 名 字 。 这 个 名 字 就 是 用 户 后 面 使 用 Open 来 打开 的 设备 
的 名 字 。 

xxDevCreate (name,，…) 

则 从 系统 中 删除 一 个 设备 。 

在 模块 初始 化 部 分 ,模块 的 初始 化 工作 为 应 用 程序 提供 了 打开 一 个 设备 类 驱动 之 间 的 关 
联 ,而 设备 的 创建 为 应 用 程序 最 终 打 开 某 个 具体 的 设备 提供 软件 的 实现 。 具 体 来 说 ,例如 :有 
一 个 UART 驱动 , 它 可 以 支持 4 个 UART 硬件 ,这 4 个 不 同 的 UART 硬件 的 MO 地 址 各 不 
相同 ,举例 说 ,基地 址 分 别 是 0x10002000,0x10002100,0x10002200,0x10002300。 而 对 于 每 一 
个 具体 的 物理 设备 ,其 基本 操作 都 是 一 样 的 ,包括 各 个 类 似 寄 存 器 的 偏 移 地 址 都 一 样 , 对 寄存 
器 的 操作 也 一 样 。 在 Linux 中 ,驱动 通过 主 设备 号 来 注册 这 一 类 设备 的 驱动 ,在 后 面 可 以 看 
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到 ,从 设备 号 用 于 驱动 内 部 区 分 不 同 的 设备 。 同 样 的 ,在 WinCE 中 ,也 使 用 "COM” 的 前 缀 来 
标识 一 类 设备 的 驱动 ,而 用 0 一 9 等 10 个 不 同 的 后 缀 来 区 分 不 同 的 物理 设备 ,从 而 一 个 
WinCE 驱动 最 多 可 以 支持 10 个 同类 型 .不 同 的 物理 设备 。 

2. 设备 操作 例 程 

设备 操作 例 程 就 是 对 物理 设备 进行 真实 操作 的 函数 。 它 就 是 通常 见 到 的 Read, Write， 
Ioctl 这 类 的 函数 。 

对 于 设备 的 读 、 写 操作 ,常常 伴随 着 数据 的 传输 。 如 前 面 讨 论 的 那样 ,常常 通过 查询 .中 断 
和 DMA 的 方式 配合 设备 的 读 、 写 操作 。 有 时 采取 阻塞 等 待 的 机 制 。 

read() ,write() 系 统 调用 常 采 取 下 面 的 原型 接口 , 


Nbytes = read (fd,buffer,max_byte_to_be_read) ; 


Nbytes = write (fd,buffer,write_len); 


其 中 ,对 于 read() 函 数 ,fd 是 通过 Open 打开 的 文件 描述 符 , Buffer 用 于 存放 读 回 来 的 数 
据 ,max_byte_to_be_read 是 buffer 里 能 够 容纳 的 .最 多 读 操作 的 字 节 数 ,返回 值 Nbytes 是 实 
际 读 到 的 字 节 数 。 

对 于 write () 函 数 ,fd 是 通过 Open 打开 的 文件 描述 符 ,Buffer 里 保存 着 用 于 输出 到 设备 
的 数据 , write_len 是 数据 的 长 度 ,返回 值 Nbytes 是 实际 写 操作 的 字 节 数 。 例 如 :应 用 程序 可 
以 使 用 写 操作 来 向 一 个 声卡 设备 输入 PCM 音频 采样 数据 。 

Iocti 主要 用 于 对 设备 的 属性 进行 配置 。Ioctl 几乎 可 以 对 设备 进行 所 有 的 操作 。 操 作 系 
统 对 于 Ioctl 所 要 提供 的 功能 没有 统一 的 定义 ,应 用 程序 能 够 通过 Ioctl 对 驱动 执行 什么 样 的 
配置 以 及 操作 ,完全 取决 于 驱动 的 实现 。 因 此 ,对 于 Ioctl 的 操作 需要 针对 驱动 所 提供 的 应 用 
编程 接口 (APD 文 档 。 

应 用 程序 通过 调用 系统 调用 Ioctl 来 实现 对 设备 的 控制 操作 。 系 统 调用 Ioctl 有 2 个 主要 
参数 :一 个 是 Ioctl 将 要 执行 命令 的 命令 字 , 另 一 个 是 这 个 命令 所 需要 的 一 个 参数 , 它 可 以 是 一 
个 数据 结构 的 指针 ,从 而 允许 用 户 传 人 任意 数目 或 任意 结构 类 型 的 参数 给 这 个 命令 。 通 过 定 
义 各 种 不 同 的 命令 , 辅 以 各 种 不 同 的 命令 参数 ,就 可 以 实现 对 设备 各 种 各 样 的 操作 ,甚至 于 可 
以 通过 Ioctl 来 对 设备 进行 读 或 写 操作 。 

例如 :可 以 通过 Ioctl 来 对 串口 设置 波 特 率 ,设备 数据 长 度 格式 ,停止 位 和 校 验 位 等 格式 ; 
可 以 通过 Ioctl 来 设置 声卡 的 声 道 数 目 , 设 置 音量 和 设置 比特 率 等 。 

小 结 : 

通过 上 面 的 讨论 ,结合 多 个 操作 系统 的 驱动 结构 ,讨论 了 设备 驱动 在 初始 化 ,以 及 对 设备 
进行 操作 所 需要 处 理 的 事务 的 共性 。 由 此 读者 可 以 通过 对 比 ,理解 驱动 中 各 种 各 样 函 数 接口 
的 真实 用 途 ,而 不 至 于 在 实际 开发 中 不 知 所 云 ,从 而 无 从 下 手 。 知 道 了 驱动 的 内 部 结构 关系 ， 
也 就 知道 在 那 一 个 接口 函数 作 什么 样 的 处 理 和 操作 。 在 上 面 着 重 讨论 了 : 
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中 驱动 层次 的 初始 化 。 

@@ 设备 的 创建 ,设备 层次 的 初始 化 。 

@ 读 写 控制 例 程 。 

在 第 一 个 层次 ,主要 负责 对 操作 系统 接口 方面 的 登记 ,对 所 有 设备 公用 的 那 部 分 进行 初始 
化 ,包括 软件 、 硬 件 的 初始 化 工作 ,都 放 在 驱动 的 初始 化 部 分 。 而 在 第 二 个 层次 ,是 针对 于 特定 
的 设备 实例 所 进行 的 初始 化 工作 。 

最 后 ,还 要 说 明 一 点 ,如 果 所 开发 的 驱动 只 支持 一 个 实例 ,这 种 情形 会 变 得 相对 简单 , 即 初 
始 化 的 工作 可 以 在 驱动 层面 里 做 ,也 可 以 在 设备 初始 的 层面 上 做 。 这 样 的 情况 很 多 ,一 些 初学 
者 在 刚 开 始 编写 驱动 的 时 候 , 没有 和 弄 明白 上 面 的 道理 ,虽然 这 种 含混 的 初始 化 方式 都 可 以 工 
作 , 但 是 遇 到 情况 复杂 化 的 时 候 ,就 容易 出 现 错误 。 因 此 ,即使 对 于 单一 实例 的 设备 驱动 ,在 编 
写 驱 动 的 时 候 仍 然 要 做 到 心中 有 数 , 按 规范 的 方式 编写 驱动 ,不 但 可 以 提高 自己 的 驱动 设计 能 
力 ,还 能 够 使 以 后 的 维护 简单 容易 。 


。 
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VxWorks 的 驱动 模型 


在 这 一 章 里 ,将 深入 讨论 VxWorks 下 的 模型 驱动 ,深入 讨论 VxWorks 中 IO 系统 的 内 
部 结构 ,从 而 加 深 驱 动 与 7O 之 间 的 接口 以 及 文件 系统 之 间 相 互 关系 的 理解 。 


S.1 VxWorks 的 IO 系统 


条 二 的 和 半生 和 上古 丰 村 生计 二 让 几 尖 的 和 汪 二 攻 0 疝 生 人 天 省 


下 面 以 VxWorks 为 例 来 分 析 一 下 操作 系统 的 IO 系统 ,由 此 更 深入 地 了 解 应 用 程序 、 操 
作 系 统 核心 和 设备 驱动 之 间 的 层次 关系 。 

IO 系统 的 目的 在 于 为 应 用 程序 提供 与 具体 设备 无 关 的 统一 接口 ,从 而 使 应 用 程序 可 以 像 
读 写 文件 一 样 对 外 围 硬 件 设备 进行 读 . 写 和 参数 配置 ,而 无 需 了 解 设 备 的 具体 实现 细节 与 差异 。 

如 前 所 述 ,一 个 系统 中 一 般 有 以 下 几 种 类 型 的 设备 驱动 ， 

@ 面向 字符 型 的 设备 ,例如 终端 . 串 行 设备 或 键盘 接口 。 

@ 块 设备 。 其 特点 是 可 以 随机 访问 指定 的 块 。 

图 网 络 设备 。 它 用 于 存 取 远 端的 设备 。 

图 除 此 之 外 还 有 一 些 虚拟 的 设备 ,或 监控 控制 设备 。 例 如 :进程 间 的 管道 或 套 接 字 。 


s.1.1 JIVO 系统 概述 


首先 看 一 个 系统 中 应 用 程序 .I/O 系统 以 及 驱动 之 间 的 层次 关系 。 

一 般 情 况 下 ,用户 应 用 程序 对 于 设备 的 操作 ( 读 写 控制 ) 请 求 ,首先 是 通过 操作 系统 提供 的 
通用 文件 接口 传递 给 操作 系统 。 操 作 系统 负责 这 部 分 接口 的 是 IO 系统 。 

在 用 户 请 求 传递 到 驱动 的 真实 操作 之 前 ,已 经 由 MO 系统 作 了 大 量 的 处 理工 作 。 但 是 ， 
VxWorks 作为 一 种 实时 性 很 强 的 戏 人 式 操作 系统 , 它 的 IO 系统 只 是 做 了 很 少量 的 处 理 , 只 
作 了 一 些 简 单 的 交换 (switch) 工 作 , 而 把 绝 大 部 分 的 处 理工 作 交 由 设备 驱动 的 实现 者 去 实现 。 

这 样 做 的 好 处 ,是 去 除了 操作 系统 繁琐 无 用 的 操作 ,但 同时 带 来 的 问题 是 驱动 程序 的 设计 
者 需要 用 大 量 的 程序 去 处 理 一 些 协议 事务 ,增加 了 驱动 编写 的 麻烦 ,为 此 ,VxWorks 提供 了 
High - level 的 例 程 库 ， 于 是 驱动 程序 的 开发 者 在 需要 的 时 候 可 以 使 用 这 些 例 程 库 ， 而 对 于 不 
需要 这 些 管理 的 ,驱动 与 用 户 程序 的 交互 就 非常 快 。 
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s-1 驱动 在 系统 中 的 层次 结构 


3 VxWorks 的 7O 系统 支持 以 下 几 种 类 型 的 设备 : 

d@) 字符 型 设备 。 例 如 :终端 (terminal) 或 通信 线 Ccommunication line) 。 

@ 随机 存 取 的 块 设备 。 例 如 :磁盘 (disk) 。 

峡 虚拟 设备 。 例 如 :任务 间 的 管道 (Pipe) 或 套 接 字 (socket) 。 

鸭 监视 或 控制 的 IO 设备 。 倒 如 :数字 或 模拟 的 IO 设备 。 

@@ 访问 远程 设备 的 网 络 设备 。 例 如 :以 太 网 卡 。 

VxWorks 的 IO 系统 支持 两 种 类 型 的 IO: 

@ 基本 IO:(Basic I/O) 是 与 Unix 系统 兼容 的 。 

@) 缓冲 IO:(Buffered I/O) 是 与 ANSI C 兼容 的 。 

在 内 部 ,VxWorks 采用 统一 的 结构 。 在 这 一 章 , 先 讨论 文件 和 设备 以 及 从 用 户 的 观点 来 
看 这 两 种 IO。 

图 5-2 给 出 了 VxWorks 的 IVO 系统 中 ,各 个 组 成 部 分 之 间 的 调用 层次 关系 。 在 这 个 框 
图 中 ,可 以 看 到 ,缓冲 IO 最 终 定向 到 基本 IJO。VxWorks 内 部 .基本 I/O 和 缓冲 MO 使 用 统 
一 的 结构 。 

块 设备 是 与 文件 系统 相关 联 的 ,对 于 块 设备 的 访问 请 求 需要 通过 文件 系统 例 程 作 预 处 理 。 
原因 是 什么 呢 ? 作为 结构 化 的 存储 设备 上 的 文件 (简称 “磁盘 文件 ”是 以 块 为 单位 来 存 取 的 ， 
磁盘 文件 存储 的 位 置 ,需要 通过 文件 系统 当中 的 目录 来 检索 ,以 定位 一 个 磁盘 文件 实际 存放 的 
物理 位 置 ,而 文件 系统 例 程 正 是 需要 作 这 项 管理 与 计算 。 它 把 对 一 个 文件 六 字 节 的 读 取 或 写 
入 转换 为 对 块 设备 上 第 Nxx 抉 或 多 个 块 进行 的 读 写 操作 。 文 件 系 统 的 驱动 将 会 做 这 些 计 算 、 
转换 和 维护 。 

对 于 非 - 块 设备 (non - block device) ,设备 无 关 的 基本 IVO 例 程 将 直接 定向 到 驱动 例 程 。 
驱动 例 程 最 终 操 作 硬 件 设备 。 
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图 5-2 VxWorks IMO 系统 的 调用 关系 


另外 ,驱动 例 程 还 可 以 调用 “辅助 库 例 程 ”。 前 面 已 经 提 到 ,VxWorks 这 样 设 计 的 目的 是 
给 驱动 设计 者 提供 更 多 ,更 灵活 的 控制 权 , 在 核心 IO 中 ,VxWorks 实现 了 极 少 的 处 理 , 而 为 
驱动 设计 者 提供 了 一 系列 辅助 的 库 例 程 , 以 备 设计 时 选用 。 增 加 了 整个 系统 的 灵活 性 和 IO 
系统 的 调用 开销 ,从 而 提高 了 实时 性 ,提高 了 效率 。 


5.1.2 文件 名 与 设备 


在 操作 系统 中 ,设备 是 通过 命名 文件 来 访问 的 ,这 里 的 文件 与 平常 说 的 文件 系统 中 用 于 存 
放 数据 的 文件 有 更 广泛 的 涵义 。 它 包括 两 类 : 

外 非 结构 化 组 织 的 “原始 "设备 。 例 如 :一 个 串 行 通信 通道 ,或 是 一 个 任务 间 通 信 的 管道 
这 种 类 型 的 文件 设备 ,就 是 常 指 的 设备 文件 。 

结构 化 组 织 的 .可 以 随机 存 取 的 逻辑 文件 。 这 种 类 型 的 文件 就 是 通常 意义 的 文件 系统 
中 的 文件 。 

在 应 用 程序 设计 中 ,怎样 去 命名 这 两 类 文件 呢 ? 对 于 第 二 种 文件 ,在 平常 的 应 用 程序 中 已 
经 很 熟悉 了 。 这 里 把 几 种 文件 名 字 方 式 归纳 一 下 ， 


/usr/mydoc/test. txt ;这 是 常 义 的 文件 系统 中 的 文件 
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/pipe/mypipe 这 代表 一 个 任务 间 通 信 的 pipe, 习 惯 地 以 /pipe 作 前 级 

/tty0 ;这 代表 一 个 物理 设备 

一 个 文件 名 通过 一 个 字符 串 来 表示 : 

非 结 构 化 的 设备 被 指定 了 一 个 设备 名 来 表示 。 结 构 化 文件 系统 设备 ,其 设备 名 后 面 紧 跟 . 
着 文件 名 。 例 如 :DEV1:Vfilel 可 能 指示 一 个 文件 包 el 在 一 个 DEV1 设备 上 。 

当 一 个 文件 名 字 被 指定 在 一 个 MO 调用 中 时 ,IO 系统 将 在 系统 中 所 有 登记 了 的 设备 各 
当中 查找 。 当 找到 一 个 设备 的 名 字 至 少 与 调用 时 指定 的 文件 名 的 最 前 面子 串 相 匹 配 时 ,这 个 
I/O 调用 就 定位 到 这 个 设备 。 

如 果 所 有 的 设备 名 都 无 法 匹配 , 则 IVO 系统 把 这 个 调用 定位 到 一 个 默认 的 设备 (default 
device) 。 系 统 中 任 一 个 设备 ,甚至 于 不 存在 的 设备 都 可 以 被 指定 为 默认 设备 。 如 果 匹 配 最 终 
失败 , 则 这 个 MO 调用 (通常 是 一 个 打开 文件 的 调用 ) 则 返回 错误 , 即 打开 失败 。 

非 - 块 设备 的 设备 文件 是 在 它们 被 加 人 到 IO 系统 中 时 被 登记 的 ,通常 是 在 系统 初始 化 
时 ,I/O. 系 统 加 载 了 的 设备 驱动 ,都 将 被 登记 。 而 块 设备 是 与 文件 系统 相关 的 , 当 一 个 块 设备 
被 初始 化 时 , 它 指 定 了 特定 的 文件 系统 ,初始 化 完成 后 , 块 设备 的 设备 文件 名 被 加 到 IO 系统 
中 ,这 个 块 设备 文件 名 就 是 常 义 数据 文件 的 前 绥 。 


s.1.3 基本 IO 


在 VxWorks 中 ,基本 I/O 是 处 于 IVO 系统 的 最 底层 。VxWorks 的 基本 I/O 包含 7 个 基 
本 函数 , 它 与 标准 C 库 的 XO 原 主 相 兼 容 。 它 们 是 : 


Creat ( ); 创建 一 个 文件 

remove (〈 ) ; 删除 一 个 文件 

open ( ); 打开 一 个 文件 , (可 选 地 ,创建 一 个 文件 
Close ( ); 关闭 一 个 文件 

read ( ); 读 一 个 先前 创建 的 或 打开 的 文件 

write(〈 ); 写 一 个 先前 创建 的 或 打开 的 文件 write (); 
ioct1 ( ); 对 一 个 文件 或 设备 执行 指定 的 控制 操作 

1. 文件 描述 符 


在 基本 IO 层 ,文件 使 用 一 个 文件 描述 符 (fd) 来 引用 。 文 件 描述 符 是 在 调用 open〈 ) 或 
create《〈 ) 时 返回 的 一 个 小 的 整数 。 其 他 的 基本 IO 例 程 需要 使 用 这 个 弓 作为 一 个 参数 来 指 
示 特 定 的 文件 。fd 对 于 用 户 来 说 是 没有 什么 意义 的 , 它 只 是 XO 系统 内 部 来 标识 正在 处 理 的 
不 同文 件 。 如 果 一 个 文件 关闭 ,这 个 小 整数 可 以 被 用 来 返回 给 随后 的 其 他 文件 的 打开 操作 。 

在 VxWorks 中 ,可 以 使 用 的 文件 描述 符 是 有 限 的 ,所 以 当 一 个 文件 不 使 用 时 ,尽量 关闭 
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文件 。 事 实 上 给 是 VxWorks 内 部 维护 的 一 个 文件 打开 的 数组 的 下 标 ,数组 大 小 是 有 限 的 ,所 ，| 撤 


以 文件 描述 符 也 是 有 限 的 。 从 
2. 打开 和 关闭 文件 坎 
在 对 一 个 设备 进行 IO 操作 之 前 ,必须 通过 creat( ) 或 open( ) 来 打开 一 个 设备 。 传 递 给 件 
open 的 参数 是 文件 名 或 设备 文件 名 、 存 取 的 类 型 标志 和 访问 的 模式 。 诗 
fd = open〈"name" ,flags,mode); | 
“name” 一 即 为 文件 名 。 想 
flags 一 是 存 取 的 类 型 标志 。 它 可 以 取 值 :0O_RDONLY,O_WRONLY,O_RDWR,O_ | 与 
CREAT,O_TRUNC。 其 含义 不 再 歼 述 。 深 

mode 一 是 设置 访问 权限 的 比特 标志 。 
close (fd); 了 335 


关闭 一 个 打开 的 文件 。 
3. 创建 与 删除 文件 


fd = creat《〈"name" ,flags)3 

remove〈"name" ) 

在 面向 文件 的 设备 上 ,可 以 通过 creat( ) 和 remove( ) 来 创建 和 删除 一 个 文件 。 创 建 一 个 
新 文件 与 打开 一 个 文件 的 参数 类 似 , 只 不 过 是 它 可 以 创建 一 个 事先 不 存在 的 文件 。Remove 
从 设备 上 删除 一 个 文件 , 当 一 个 文件 处 于 打开 状态 时 ,不 能 删除 这 个 文件 。 

在 非 - 面 向 文件 的 设备 上 ,creat ( ) 的 作用 与 open〈 ) 完 全 一 样 。Remove(〈 ) 操 作对 于 这 
类 设备 不 起 任何 作用 。 

4. 文件 的 读 、 写 和 控制 等 操作 


nbytes = read (fd,Sbuffer,maxBytes)5 
nbytes = Write (fd,S&buffer,nBytes); 
resSult = jioctl (fd,function_codeyarg); 


对 文件 的 读 写 操作 的 含义 不 再 蓝 述 。 
Ioctl〈 ) 用 于 对 一 个 设备 进行 状态 .参数 的 查询 与 设置 。 例 如 设置 UART 串口 人 
设置 声卡 的 音量 ,通道 数目 ,可 用 如 下 代码 所 示 : 
status = ioctl (fd_URRTO ,FIOBAUDRRTE,9600arg); 


status = jioct1l (fd_audio_dsp,E_AMU_ VOLUME ,60) 
Status = ioct1l (fd_audio_dsp,F_RAMU_CHRNNEL ,2)5 


Ioctl( ) 函数 所 能 提供 的 功能 代码 以 及 参数 的 取 值 意义 和 范围 ,完全 是 由 驱动 程序 设计 者 
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提供 的 ,因此 驱动 程序 设计 者 在 设计 完 一 个 驱动 之 后 ,一 定 要 有 完整 的 文档 来 描述 这 个 驱动 可 
以 支持 的 设置 与 查询 方面 的 功能 ,以 及 参数 的 设置 范围 和 意义 。 

如 上 面 所 示 :F_AU_VOLUME 功能 码 , 它 是 一 个 宏 , 可 能 表示 一 个 整数 值 , 例 如 12〈 间 
define F_AU_VOLUME 12) ,可 用 它 来 设置 音量 ,而 音量 的 取 值 范围 设置 为 0 一 100, 其 中 
0 表示 Mute( 无 声 ) ,100 表示 最 大 音量 。 


s.1.4 缓冲 IO 


缓冲 (buffered) IO 与 UNIX 完全 兼容 ,与 Windows 的 Stdio 兼容 ,从 而 提供 了 完全 的 
ANSI C 支持 。 

需要 注意 的 是 ,printf ( ) ,sprintf ( ) 以 及 sscanf ( ) 传 统 地 被 归结 为 Stdio 的 一 部 分 ,但 在 
VxWorks 中 ,把 它 作 为 格式 化 的 I/ZO 来 处 理 (Formatted I/O) 。 

什么 是 缓冲 LO 呢 ? 它 与 基本 IO 有 何不 同 ? 

前 面 已 经 讨论 过 ,VxWorks 的 IXO 系统 核心 只 处 理 了 很 少量 的 定位 操作 ,效率 是 很 高 的 ， 
但 是 基本 IXO 仍然 有 一 部 分 开销 。 例 如 : 

首先 ,分 发 设备 无 关 的 调用 (read( ), write ( ) ,等 等 ) 到 设备 相关 的 例 程 C(xxRead( )， 
xxWrite( ) ) 。 

其 次 ,用 户 可 能 使 用 了 互 斥 访问 机 制 , 以 免 与 别 的 用 户 操 作 相 互 干扰 。 

假如 用 户 每 次 调用 read( ) 从 一 个 文件 中 读 取 一 个 字符 ， 


n= read (fd,&buffer,1); 


那么 大 量 的 这 种 操作 ,如果 每 次 都 要 从 物理 设备 上 去 取 一 个 字符 ,就 会 增加 太 多 的 额外 开 
销 。 而 缓冲 Buffered IO 使 用 一 个 文件 缓冲 ,每 次 从 设备 里 读 和 人 一 个 Buffer 长 度 的 数据 ,组 
冲 在 系统 内 部 ,当下 次 用 户 希 望 读 回 一 个 字符 时 ,不 是 从 设备 里 取 数 据 , 而 是 从 Buffer 里 直接 
取 数 据 , 直 到 缓冲 里 的 数据 全 部 读 完 , 才 再 从 物理 设备 上 去 读数 据 , 这 种 机 制 就 叫做 缓冲 IO。 
可 以 看 出 缓冲 MO 是 基于 Basic IO 的 。 

使 用 缓冲 IO 需要 使 用 另 一 套 API 来 对 文件 进行 打开 和 关闭 。 

FILE x* ”fp = fopen("/usr/myfilet"，"r")? 

fclose (fp); 

随后 的 读 写 和 操作 采用 :fread( ),fwrite( ) 或 gete( ),pute( )。 后 者 是 每 次 读 写 一 个 字 
符 的 宏 。 例 如 


Da= fread(〈(&buff，sizeof(DRATR_TYPE) ，num_of_data，fp); 


s.1.$ 格式 化 IO 


在 VxWorks 中 ,printf( ) ,sprintf( ) ,sscanf( ) 当 作 格 式 化 IO 来 实现 。 
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5.2 ”VxWorks 的 驱动 及 其 内 部 结构 
和 

如 前 面 所 讨论 ,在 MO 系统 里 有 3 个 主要 的 元 素 :驱动 .设备 和 文件 。 设 备 文件 起 到 用 户 。 | 件 
访问 设备 的 桥梁 作用 ,或 者 说 是 访问 设备 的 访问 点 。 VxWorks 中 主要 有 两 种 类 型 的 驱动 ,一 这 
种 是 字符 型 的 驱动 , 另 一 种 是 块 设 备 驱动 。 块 设备 驱动 必须 跟 一 个 文件 系统 交互 ,作为 一 个 人 


门 的 教程 以 及 简化 起 见 , 这 里 主要 讨论 字符 型 的 驱动 。 有 兴趣 的 读者 可 以 在 以 后 的 深化 学 习 | 完 
中 参考 VxWorks 的 编程 文档 进行 自学 。 想 
下 面 看 一 个 假想 的 驱动 的 例子 。( 下 面 的 代码 摘自 VxWorks Programmerys Guide) 。 
A/ 尖 关 尖 产 闫 尖 源头 关 关 针尖 关 关 关 关 源源 关 关 关 关 关 关 关 关 并 关 凑 产 尖 凑 尖 尖 就 类 关 关 类 关 兴业 关 尖 关 关 关 关 关 尖 关 关 关 半 ;去 
区 xxDrv- 驱动 的 初始 化 函数 
TI37 
关 xDrv() 初始 化 这 个 驱动 
共 它 通过 iosDrvInstall() 安 装 驱 动 , 可 能 分 配 数据 
类 结构 ,连接 中 斯 服务 例 程 (ISRs) ,以 及 初始 化 硬件 。 


闪 关 关 尖 关 关 其 其 关 基 关头 其 尖 关 其 关 沽 关 关 次 凑 关 闫 关 凑 关 其 关头 头头 其 其 并 次 关 尖 关 关 凑 关 关 关 关 关 深 关 尖 闪光 尖 产 关 / 
STRATUS xxDrv( ) 
《 
xDrvNum = iosDrvInstal1 (xxCreat ,0 ,cx0pen,0 ,xxRead， 
XxWTite ,xxIOct1); 


《void) intConnect (intvec,xxInterrupt，. ..); 


} 

/和 尖 兴 闪闪 尖 兴 关 尖 类 关 尖 关 尖 关 关 尖 关头 尖 关头 关 闪闪 关 尖 次 关 闪闪 关 尖 尖 关 尖 尖 关 关 尖 关 关 尖 次 尖 尖 关 闪闪 兴 关 闪闪 尖 关 
X xDevCreate -设备 创建 函数 

% 调用 这 个 函数 用 于 向 系统 增加 一 个 设备 ,其 名 字 由 <<name> 指 定 , 这 个 设备 

# 将 由 这 个 驱动 来 服务 。 其 他 与 驱动 相关 联 的 参数 可 能 包括 ， 

缓冲 区 的 长 度 , 设 备 的 地 址 等 。 


兴 这 个 函数 通过 调用 iosDevahdd 将 这 个 设备 添加 到 I/O 系统 中 。 
X 它 可 能 也 会 分 配 和 初始 化 用 于 这 个 设备 的 数据 结构 ,初始 化 信号 量 ， 
关 初始 化 设备 硬件 等 。 


关 兴 兴 尖 尖 半 关头 关头 关头 兴 凑 关 关 关头 关头 关 关 源 尖 凑 尖 关 关 关头 关 关 尖 关 六 并 尖 并 尖 关头 关头 次 尖 关 关头 其 关 关 其 关 / 
STRATUS xxDevCreate (char x name ..,) 


{ 
status = iosDevahdd (xzxDev,name ,xcxDrvNum) ; 
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挫 } 

入 了 证 放 征 让 汪 果 计 半 全 革 交 和 证 的 村 证 其 证 计生 证 交 不 源 半 二 放 证 关 二 半天 革 竺 计时 入 尖 生计 洒 于 各 是 训 训 全 二 证 
软 x* 下面 的 函数 实现 基本 的 I/0 功能 

次 : 

件 

讼 X xcx0pen() 返 回 的 值 仅 对 于 这 个 驱动 有 意义 , 它 必 须 在 随后 对 这 个 

计 设备 文件 操作 的 其 他 I/9 函数 调用 时 , 当 作 参 数 被 传 回 。 

， 闪闪 闪闪 关 关 关头 类 闪闪 关 尖 类 尖 尖 闪闪 关 关 关 凑 头 尖 其 六 关 尖 闪闪 类 关 关 凑 尖 次 其 尖 关 闪闪 关头 关 其 关头 关 尖 尖 尖 闪闪 尖 / 
所 int xzxOpen (XXDEV x xxDevychar x remainder,int mode) 

起 

-如 /* 串 行 设备 必须 没有 文件 名 字 部 分 * / 

方 if (remainder[0] 1= 0) 

法 returmn (ERROR) 

else 

138 return ((int) xxDev) ; 


》 
int xxRead (XXDEV x 3crDev,char x* buffer， int nBytes) 


int CNrite (xxDev,buffer,nBytes) 
int 3cxIoct1 (3cxDev ,requestCode ,arg) 


W 闪闪 共 关 关 关 关 关 关 关 关 关 关 兴 关头 类 尖 关 关 关头 尖 关 关 关 关 关 关 关 关 尖 关 尖 尖 尖 尖 关 关 其 关头 尖 关 站 尖 关头 关 关 关 关 其 关 


类 xcxInterrupt - 中 断 服 务 例 程 


关 很 多 驱动 里 面包 含有 中 断 处 理 例 程 ,以 响应 从 设备 产生 的 中 断 , 由 该 
关 驱动 进行 服务 。 这 些 服务 例 程 通过 调用 intConnect() 连 接 到 特定 
类 的 中 断 , 典 型 地 ,intConnect 在 xxzxDrv() 中 调用 。 


中 浙 服务 例 程 可 以 接受 一 个 单一 的 参数 ， 在 调用 intConnect 时 指定 。 
兴 (see intLib) . 
闪闪 关 兴 兴 关 关 兴 关 关 关头 闪闪 闪闪 凑 尖 关头 关 关 关头 关 关 关 尖 尖 关 关 关 关 关 尖 关 闪闪 关 兴 尖 兴 关 关 关 关头 关 关 关 关 其 关 关 A 


VOID xceInterrupt (arg) 


在 这 个 驱动 的 例子 中 ,每 一 个 函数 前 面 都 有 一 个 前 缀 “xx”, 这 一 个 前 缀 是 一 个 比较 重要 
的 概念 , 它 代 表 一 个 驱动 在 系统 中 唯一 的 缩写 名 字 。 We 等 。 在 本 书 的 例子 
里 ,使 用 xx? 来 代表 设备 的 缩写 名 字 。 


s.2.1 驱动 的 安装 、 驱 动 表 
STATUS xxDrv ( ) 是 一 个 驱动 程序 的 和 人口 。 正 如 前 面 章节 讨论 的 那样 , 它 需 要 初始 化 
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这 个 驱动 ,然后 通过 一 个 系统 调用 。iosDrvInstall 向 IVO 系统 注册 这 个 驱动 ,而 其 中 的 参数 ， 
正 是 这 个 驱动 所 实现 的 7 个 IO 基本 孙 数 的 人 口 地 址 。 注 意 到 参数 中 某 些 函数 的 人 口 被 设置 
成 为 0, 其 意思 是 7 个 基本 函数 并 不 一 定 都 必须 实现 。 

在 驱动 的 初始 化 例 程 中 ,可 以 允许 分 配 数据 结构 ,连接 一 个 中 断 服务 向 量 以 及 初始 化 硬 
件 。 当 然 也 可 以 把 硬件 的 初始 化 工作 留待 Create Device 那 步 去 做 。 这 取决 于 所 要 初始 化 的 
硬件 是 多 个 设备 实例 所 共用 的 ,还 是 单个 设备 所 独 有 的 。 

前 面 已 经 讲 过 ,驱动 的 人 口 不 同 于 应 用 程序 的 main 函数 ,main 函数 的 生存 期 是 整个 程序 
的 运行 时 期 ,而 xxDrv() 人 口 函 数 只 是 在 驱动 被 加 载 时 被 调用 。 事 实 上 ,函数 也 只 是 当 用 户 有 
操作 时 才 会 被 调用 到 。 从 这 个 意义 上 讲 , 驱 动 程序 不 外 乎 为 应 用 程序 提供 了 一 系列 的 函数 调 
用 例 程 ,它们 本 身 没 有 运行 执行 体 。 但 是 情况 也 不 完全 是 这 样 的 ,如 果 驱 动 内 部 需要 等 待 某 些 
事件 的 产生 ,那么 在 一 个 驱动 里 可 能 要 创建 一 个 任务 , 称 之 为 内 核 线 程 (VxWorks 中 叫 任 务 ) 。 
这 种 情况 下 ,这 个 驱动 中 的 一 个 或 多 个 内 核 任务 会 一 直 不 停 地 在 系统 中 运行 着 。 它 们 (内 核 任 
务 线程 ) 与 应 用 程序 的 任务 一 样 ,依据 优先 级 别 会 被 CPU 调度 到 。 

除了 内 核 任 务 之 外 ,驱动 中 的 其 他 线程 是 在 用 户 请 求 之 后 ,通过 I/O 系统 分 发 到 这 个 驱 
动 时 被 运行 的 ,所 以 驱动 中 的 例 程 是 运行 在 用 户 调用 任务 的 上 下 文 空 间 里 的 (User calling 
task's context) 。 由 此 ,驱动 里 的 例 程 可 以 自由 地 使 用 跟 用 户 程序 一 样 的 所 有 的 系统 调用 ,这 
包括 互 斥 访问 的 临界 区 机 制 和 信和 号 量 机 制 。 

总 之 ,除了 ?7 个 基本 函数 之 外 ,VxWorks 驱动 里 还 包括 其 它 3 个 额外 的 例 程 

人 中 xxDrv (〈 ), 它 是 驱动 的 人口。 在 该 例 程 中 , 它 要 向 MO 系统 里 注册 这 个 驱动 以 及 它们 
的 7 个 基本 函数 的 入口 ,连接 中 断 向 量 以 及 进行 必要 的 硬件 初始 化 。 

@ xxDevCreate( ) ,向 IXO 系统 里 增加 一 个 设备 ,这 个 设备 由 本 驱动 提供 服务 。 

@ 中 断 例 程 , 它 提供 与 设备 相连 接 的 中 断 的 服务 例 程 。 中 断 例 程 是 由 驱动 初 使 化 时 安 
装 , 向 系统 登记 注册 一 个 回调 函数 ;如 果 设 备 上 有 硬件 事件 发 生 ,满足 对 设备 配置 的 中 断 触发 
条 件 , 则 设备 硬件 向 CPU 发 出 一 个 外 部 中 断 请 求 ;CPU 中 断 中 央 处 理 程序 判明 外 部 中 断 来 
源 , 并 查找 系统 中 断 向 量 表 , 然 后 转 人 到 中 断 服务 例 程 开始 执行 对 硬件 中 断 的 服务 。 

在 这 里 ,也 看 到 了 VxWorks 的 一 些 人 缺陷 。VxWorks 有 驱动 安装 的 例 程 , 而 没有 驱动 印 载 
的 例 程 。 同 样 ,有 设备 创建 的 例 程 ,而 没有 设备 删除 的 例 程 。 

驱动 表 (driver table) 与 驱动 的 安装 

VxWorks 的 MO 系统 核心 维护 了 一 个 表 , 这 就 是 系统 中 所 有 已 经 加 载 的 驱动 表 。 在 这 个 
驱动 表 中 ,记录 了 每 一 个 驱动 的 7 个 基本 LO 操作 例 程 的 人 口 地 址 。 

下 面 是 这 个 过 程 的 详细 说 明 。 其 中 iosDrvInstall ( ) 是 IO 系统 提供 给 驱动 的 一 个 系统 
调用 。 
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drvNunm = iosDrvInstall (xxCreab 0, xxYOpen, 0, xxRead, xxYYWrite, xxjloctD; 


站 人 

疏失 

和 人 说 明 [1]: 驱动 调用 iosDrvinstal( ) ， 它 在 IO 系统 

式 中 注册 驱动 以 及 登记 7 个 基本 函数 (的 地 址 )。 

软 到 动 

{ -+ 量 ------------------- 
汉 JU/O 系 统 

下 膏 明 [4]. IO 系统 返 号 驱 说 明 [2]: IO 系统 在 驱动 表 中 寻找 
1 人 一 个 可 用 的 空 行 Glob。 

生 

征 create “Yemnaove 0pea close ”read write 

六 

尽 拉 

站 

了 140 


IO: 了 驱动 表 说 明 [3]: IO 系统 完成 登记 。 


5-3 VxWorks 驱动 安装 


s$.2.2 设备 的 创建 .设备 链表 


一 有 旦 安装 了 驱动 ,IO 系统 进一步 请 求 由 驱动 提供 的 xxDevCreat( ) 来 创建 相关 的 设备 。 
一 个 驱动 可 以 同时 服务 于 多 个 特定 类 型 的 设备 (例如 :UART0,UART1) ,每 一 个 设备 在 MO 
系统 里 都 被 称 之 为 实例 (instance) 。 同 类 型 的 设备 往往 只 是 硬件 方面 存在 局 部 的 不 同 ( 例 如 仅 
仅 是 IO 起 始 地 址 不 同 ,或 是 所 使 用 的 中 断 引 脚 号 不 同 ), 这 种 情况 就 可 以 使 用 同一 个 驱动 来 
提供 服务 。 

在 驱动 的 加 载 过 程 中 ,如 果 成 功 地 安装 了 驱动 , 则 IO 系统 会 调用 驱动 提供 的 xxDevCre- 
ate( ) 来 为 每 一 个 实例 创建 内 核 数据 结构 以 及 进行 必要 的 硬件 初始 化 过 程 , 这 些 都 在 xx- 
DevCreate( ) 中 实现 。 

在 xxDevCreate( ) 实 现 中 ,一 个 重要 的 调用 就 是 : 


iosDevadd 〈xxDev,name,xxDrvNum) ; 


如 下 所 示 


STRTUS xxDevCreate (char * pname,...) 
人 
Status = iosDevhdd ((DEV_HDR x* )xczxDev,name,xxDrvNum); 


} 


设备 数据 结构 与 设备 链表 (device list) 
在 VxWorks 中 ,每 一 个 设备 都 定义 了 一 个 数据 结构 ,叫做 设备 描述 符 (device descrip- 
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tor) ,这 个 数据 结构 里 包含 了 所 有 设备 相关 的 信息 ,包括 : 


旺 设备 的 名 字 字 符 串 ; 入 

国 服务 于 这 个 设备 的 驱动 的 驱动 号 (driver number) ; 趟 

量 这 个 设备 附加 的 特殊 的 私有 信息 。 如 设备 的 MO 起 始 地 址 ,缓冲 区 ,信号 量 ,以 及 其 他 休 
驱动 设计 者 定义 的 任何 信息 。I/O 系统 内 部 只 维护 设备 私有 数据 的 一 个 指针 。 证 

在 VO 系统 核心 里 ,只 维护 了 设备 数据 结构 的 头 部 (device header,DEV_HDR) ,这些 | 计 
HDR 组 成 一 个 链表 , 当 应 用 程序 通过 一 个 设备 名 字 调用 Open 打开 一 个 设备 文件 时 ,MO 系 | 千 
统 核 心 就 会 搜索 这 个 链表 ,进一步 定位 驱动 ,从 而 找到 相关 的 7 个 基本 I/O 访问 函数 。 机 
在 iosDevAdd 系统 调用 中 ,第 一 个 参数 xxDev 就 是 DEV_HDR 类 型 ,第 二 个 参数 则 是 这 个 | 与 
设备 的 文件 名 ,第 三 个 参数 是 服务 于 这 个 设备 的 驱动 的 驱动 号 , 它 是 设备 与 驱动 之 间 的 关联 。 六 
下 面 看 一 看 内 部 实现 的 具体 步 又 ,如 图 5 - 4 所 示 。 这 
status = iosDevAdd (dev0，"xx0" devNumy); 1 


status = iosDevAdd (dev0, "xxl"，devNunm); 


说 明 : IO ”系统 增加 设备 描述 符 到 设备 链表 。 


read write jiocti 


fciose 


create “rem0Ovye “0pen 


图 $-4 VxWorks 设备 添加 
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s$.2.3 文件 的 打开 \ 文 件 描述 符 表 


有 了 前 面 的 讲解 ,IO 系统 的 架构 已 经 逐渐 明晰 ,我 们 已 经 掌握 了 驱动 .设备 与 MO 系统 
的 关系 , 接 下 来 进一步 了 解 用 户 是 如 何 透 过 I/O 系统 与 驱动 进行 交互 的 ,如 图 5-5 所 示 。 


伺 = open ("xx0"” O_ RDONLY); 


6) 
IO 找 公 改 备 。 在 伺 表 中 登记 ， 返 回 slot 


号 作为 用 户 调 用 的 返回 。 
0 
、 1 
本 2 
3 
IO 在 fa 表 中 4 
保留 一 项 


打开 文件 描述 符 表 


根据 DEV_HDR 查 找 驱 
动 表 。drvNum=2 


用 设备 驱动 例 程 。 

设备 驱动 xxOpcn 函数 返 

回 文件 打开 相关 数据 。 

XxpDev = XxOpen (xxdev ”"，O_RDONLY); 电 
图 5-S VxWorks 文件 打开 


在 前 面 已 经 看 到 ,驱动 在 注册 一 个 设备 的 时 候 , 已 经 为 每 一 个 设备 登记 了 一 个 设备 名 字 ， 
这 些 名 字 在 设备 链表 里 必须 保持 不 重 名 。 当 采用 操作 系统 提供 的 通用 的 文件 操作 API 函数 
〈 例 如 :open( ) ,或 creat( )) 来 创建 一 个 新 文件 或 打开 一 个 新 文件 时 ,操作 系统 把 这 些 请 求 定 
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位 到 IO 系统 。LO 系统 根据 用 户 传 过 来 的 文件 名 ,在 设备 链表 里 搜索 , 找 出 最 前 面子 字符 串 | 所 
匹配 的 设备 。 如 果 没 找到 , 它 会 找 default 设备 ,如 果 还 是 没有 找到 , 则 IO 系统 返回 一 个 错 “| 从 


误 ,告诉 用 户 无 法 找到 指定 的 文件 ,打开 失败 。 人 
如 果 成 功 地 找到 ,IO 系统 则 在 内 部 维护 的 一 个 用 户 可 打开 的 文件 描述 符 表 里 添加 一 项 ， | 件 

并 返回 一 个 索引 号 (fd 的 标识 号 ) 作 为 后 续 文件 操作 的 参数 。 生 
T 

5.2.4 文件 的 读 、 写 \ 控 制 和 关闭 操作 
图 5-6 显示 了 文件 制作 的 一 个 例子 。 想 
na=read (fd，buf len); 与 

方 

法 

了 43 


加 JIMO 由 驱动 表 找到 相 
应 的 读 例 程 


Create remoyve 0Open 


回 叉 件 询 关 吕 的 个 果 
了 = XXRead (xxpDev，buf，len); 9 
图 $-6 文件 读 操 作 的 IV/O 控制 流程 
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在 这 里 ,对 文件 后 续 的 读 写 操作 已 经 不 再 使 用 设备 链表 。 有 关 设 备 的 信息 已 经 包含 在 文 
件 描 述 符 表 中 。 这 是 因为 对 于 同一 个 设备 上 不 同 的 文件 打开 维护 的 和 有 数据 不 一 样 (例如 : 文 
件 读 写 指针 ) ,因此 设备 链表 只 在 文件 的 打开 操作 时 被 使 用 到 。 但 驱动 表 却 是 所 有 的 文件 读 写 
操作 都 要 被 查找 , 以 确定 驱动 程序 的 各 个 例 程 的 调用 地 址 。 其 他 的 文件 操作 与 读 操作 类 似 。 

文件 的 关闭 则 是 在 文件 描述 符 表 中 删除 对 应 的 文件 描述 符 表 项 ,并 标记 为 空白 。 后 续 的 
文件 打开 操作 可 以 使 用 那个 表 项 。 在 藤 入 式 系统 中 ,由 于 资源 有 限 , 也 由 于 为 了 使 设计 尽 可 能 
简化 ,一 个 系统 中 用 户 能 同时 打开 的 文件 是 有 限 的 ,所 以 不 使 用 的 文件 应 当 尽 早 关闭 。 

小 结 : 

在 这 一 章 里 ,深入 分 析 了 VxWorks 中 IO 系统 的 层次 结构 以 及 它 的 MO 内 部 实现 机 制 。 
通过 实例 ,深入 地 讨论 了 IO 系统 、 驱 动 .设备 和 文件 的 概念 以 及 它们 之 间 的 相互 关系 。 

其 他 的 骨 人 式 系统 实现 的 方式 各 不 相同 ,但 是 整个 体系 和 机 制 都 是 类 似 的 ,所 要 完成 的 任 
务 也 是 类 似 的 。 因 此 深入 掌握 一 种 操作 系统 的 MO 内 部 结构 对 于 学 习 其 他 操作 系统 ,理解 其 
他 操作 系统 的 实现 也 是 非常 有 帮助 的 。 


集 贡 衬 作品 0 
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经 过 前 面 的 学 习 ,我 们 已 经 掌握 了 驱动 程序 的 基本 架构 。 驱 动 程序 是 软件 从 上 到 下 分 层 
的 结果 ,分 层 的 情况 为 : 

最 上 层 是 应 用 程序 。 

第 二 层 是 操作 系统 核心 ,如 在 第 5 章 VxWorks 的 驱动 模型 中 讨论 的 IO 系统 。 可 以 想 
象 ,I/O 系统 的 任务 就 是 管理 和 记录 系统 中 各 种 各 样 的 驱动 和 各 种 各 样 的 设备 ,维护 各 种 各 样 
的 数据 结构 ,负责 应 用 程序 对 IO 文件 访问 的 调用 分 发 。 

第 三 层 是 驱动 程序 的 实现 例 程 。 

最 下 一 层 就 是 硬件 。 

从 这 个 意义 上 讲 , 驱 动 程序 只 不 过 是 复杂 系统 软件 当中 的 一 个 部 分 ,驱动 程序 也 是 程序 ， 
所 以 在 本 书 的 基础 篇 中 反复 强调 程序 的 重要 性 。 

由 于 有 了 IO 层 的 屏 项 ,加 上 整个 操作 系统 的 源 代码 十 分 复杂 ,使 得 驱动 程序 的 初学 者 
无 法 看 清楚 层次 间 的 来 龙 去 脉 , 从 而 不 知道 驱动 程序 的 各 个 函数 中 需要 做 什么 样 的 处 理 , 所 以 
本 书 花 大 量 的 篇 幅 反 复 讲 解 驱 动 程序 的 层次 模型 结构 。 只 要 理解 了 其 中 的 道理 , 蔚 加 上 深厚 
的 程序 功底 和 必要 的 实践 ,驱动 程序 的 开发 就 会 势如破竹 。 

正如 在 第 4 章 所 讲 到 的 那样 ,一 个 驱动 程序 需要 实现 两 部 分 的 处 理 : 一 是 与 MO 系统 的 接 
口 , 即 作为 一 个 模块 的 驱动 例 程 ; 另 一 个 是 设备 的 驱动 例 程 。 在 设备 的 驱动 例 程 中 ,通过 与 硬 
件 的 交互 而 为 上 层 (IO 系统 层 ,最 终 应 用 程序 接口 层 ) 提供 对 设备 的 读 、 写 和 控制 操作 ,从 而 
使 用 户 程序 达到 与 外 部 设备 交互 数据 和 传递 信息 的 目的 。 


6.1 Linux 的 驱动 加 载 方式 


6.1.1 内 核 驱 动 模块 与 模块 化 驱动 


首先 讨论 一 下 Linux 中 驱动 的 加 载 方式 。Linux 的 驱动 有 两 种 加 载 方式 ,一 种 方式 是 纺 
译 到 系统 内 核 ,在 系统 内 核 启 动 时 一 同 加 载 ; 另 一 种 方式 是 把 一 个 驱动 编译 成 一 个 模块 ,把 一 
个 模块 理解 成 一 个 动态 函数 库 ,这 个 驱动 模块 可 以 在 操作 系统 完全 运行 起 来 之 后 ,通过 脚本 ， 
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或 是 “手动 添加 到 系统 中 。 

一 个 驱动 模块 好 比 一 个 动态 库 。 动 态 库 是 应 用 程序 在 运行 需要 的 时 候 由 操作 系统 自动 地 
装载 进来 ,或 是 由 程序 主动 地 从 磁盘 文件 系统 里 进行 装载 ,例如 :load_library。 与 动态 库 不 一 
样 的 是 ,Linux 的 驱动 作为 一 个 独立 的 模块 , 它 可 以 单独 被 加 载 ,而 不 是 在 一 个 运行 程序 的 内 
部 被 加 载 。 

驱动 被 加 载 之 后 ,从 逻辑 上 说 , 它 并 没有 运行 的 实体 ,只 是 提供 了 一 系列 例 程 , 可 以 在 应 用 
程序 需要 的 时 候 ,加 以 调用 并 为 应 用 程序 提供 服务 。 但 是 ,在 驱动 内 部 ,也 可 以 创建 内 核 线程 ， 
并 使 用 各 种 线程 同步 的 机 制 , 从 而 驱动 内 部 也 可 以 有 执行 体 。 在 很 多 时 候 , 驱 动 内 部 的 执行 体 
处 于 潜伏 休眠 状态 , 它 可 能 是 为 了 等 待 特定 的 事件 发 生 , 例 如 等 候 中 断 例 程 给 出 一 个 信号 量 。 
驱动 需要 作 长 时 间 的 处 理 , 或 是 需要 有 阻塞 或 是 需要 有 阻塞 等 待 的 机 制 , 或 是 多 个 端口 的 监听 
等 情况 下 ,都 可 以 通过 创建 内 核 线 程 的 方式 来 实现 。 内 核 线程 通过 多 种 线程 通信 机 制 实现 与 
中 断 处 理 例 程 .上 层 应 用 程序 的 调用 等 之 间 的 交互 。 


6.1.2 模块 化 驱动 的 加 载 与 卸载 


Linux 可 以 实现 随意 动态 的 加 载 与 卸载 操作 系统 部 件 。Linux 模块 就 是 这 样 一 种 可 在 系 
统 启动 后 的 任何 时 候 动 态 连 人 核心 的 程序 部 件 。 当 不 再 需要 它 时 ,又 可 以 将 它 从 系统 核心 中 
鲫 载 并 删除 。Linux 模块 多 指 设备 驱动 和 伪 设备 驱动 ,如 网 络 设备 和 文件 系统 等 。 

Linux 提供 了 2 个 命令 :使 用 insmod 命令 来 显 式 加 载 核心 模块 ,使 用 rmmod 命令 来 卸载 
模块 。 同 时 ,核心 自身 也 可 以 请 求 核心 后 台 进 程 Kerneld 来 加 载 与 印 载 模块 。 

动态 可 加 载 代码 的 好 处 在 于 可 以 让 系统 核心 保持 很 小 的 尺寸 并 且 非 常 灵活 。 使 用 模块 的 
方式 同时 还 可 以 无 需 重 构 操 作 系统 内 核 并 频繁 重新 启动 下 载 来 调试 运行 新 内 核 , 这 在 早期 开 
发 的 过 程 中 非常 有 用 ,比如 说 :每 次 因为 一 个 小 的 改动 就 要 完整 编译 一 个 Linux 操作 系统 内 
核 ,然后 把 它 下 载 到 目标 开发 板 , 并 启动 整个 内 核 。 这 样 的 调试 是 相当 耗 时 的 ,而 且 与 内 核 一 
起 运行 ,调试 不 方便 ,一 遇 问 题 , 有 可 能 还 没 看 到 问题 的 现象 ,系统 已 经 挂 起 来 了 。 

另外 一 种 则 是 在 需要 时 加 载 模块 ; 称 它 为 请 求 加 载 。 当 核心 发 现 有 必要 加 载 某 个 模块 时 
〈 例 如 用 户 安装 了 核心 中 不 存在 的 文件 系统 时 ) ,核心 将 请 求 核 心 后 台 进 程 (kerneld) 准 备 加 载 
适当 的 模块 。 这 个 核心 后 台 进 程 仅仅 是 一 个 带 有 超级 用 户 权限 的 普通 用 户 进程 。 当 系统 启动 
时 , 它 也 被 启动 ,并 为 核心 打开 了 一 个 进程 间 通 信 (IPC)? 通 道 。 核 心 在 执行 各 种 任务 时 需要 用 
它 来 向 Kerneld 发 送 消息 。 

Kerneld 的 主要 功能 是 加 载 和 外 载 核心 模块 ,但 是 它 还 可 以 执行 其 他 任务 ,如 通过 串 行 线 
路 建立 PPP 连接 并 在 适当 时 候 关闭 它 。Kerneld 自身 并 不 执行 这 些 任 务 , 它 通过 某 些 程序 如 
insmod 来 做 此 工作 。 它 只 是 核心 的 代理 ,为 核心 进行 调度 。 

模块 可 以 通过 使 用 rmmod 命令 来 删除 ,但 是 请 求 加 载 模块 将 被 Kerneld 在 其 使 用 记 数 为 
0 时 自动 从 系统 中 删除 。Kerneld 在 每 次 Idle 定时 器 到 期 时 都 执行 一 个 系统 调用 ,以 将 系统 中 
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所 有 不 再 使 用 的 请 求 加 载 模块 从 系统 中 删除 ,这 个 定时 器 的 值 在 启动 Kerneld 时 设置 。 如 果 
核心 中 的 其 他 部 分 还 在 使 用 某 个 模块 , 则 此 模块 不 能 被 卸载 。Linux 通过 模块 的 引用 计数 来 
记录 一 个 (驱动 ) 模 块 是 否 别 的 模块 或 是 否 为 应 用 程序 所 使 用 。 直 到 这 个 引用 计数 减 为 0 时 ， 
模块 才 真 正 从 系统 中 删除 。 模 块 必须 能 够 在 从 核心 被 删除 之 前 释放 其 所 分 配 的 所 有 系统 资 
源 , 如 物理 内 存 或 中 断 等 。 


人 


下 面 的 图 6- 1 直观 显示 了 Linux 驱动 程序 模块 与 操作 系统 核心 之 间 的 关系 。 
由 图 6-1 可 以 清楚 看 到 ,Linux 模块 部 分 的 驱动 ,包括 两 个 例 程 : 


人 滞 0 
due 时 Ker9el Proper 2 
0 | 
insmaod cr wm] recister_capability 人 ) 证， 
| 
apabilittesf 


Se 


0 
人 和 全 全 放任 革 人生 扩 多- 贡 际 和 AR 


6-1 Linux 驱动 与 操作 系统 核心 之 间 的 关系 
init_module( ) 和 cleanup_module( ) 。 
这 两 个 函数 是 驱动 必须 实现 的 基本 例 程 。 实 现 了 这 两 个 基本 接口 函数 ,这 个 驱动 也 就 是 
一 个 完整 的 驱动 ,就 可 以 编译 到 内 核 成 为 本 地 化 的 驱动 ,也 可 以 编译 成 模块 -模式 的 驱动 ,通过 
insmod 手动 加 载 到 系统 。 
下 面 将 通过 两 个 很 简单 的 例子 来 理解 Linux 的 编译 系统 和 Linux 的 驱动 框架 。 
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6.2.1 一 个 最 简单 的 内 核 驱 动 


x 文件 :test_drvl1.c 
x ”一 个 最 小 的 内 核 - 模式 驱动 的 例子 


闪光 
提 include “<1inux/version.h> 
井 include “<<linux/module.h> 
井 include “< 必 linuxy/ init.h> 
int init_test_kernel_drv (void) 
{ 
printf ("\n hello,world! This is my kernel - mode 
driverNn"); 
Teturn 0; 


} 


Void cleanup_test_kernel_drv (void) 
{ 

printf("N\n MY test kernel - mode driver Exits byebye! \n"); 
} 
module_init《〈init_test_kerne]l_drv); 
module_exit〈cleanup_test_kernel_drv); 


这 是 一 个 完整 的 内 核 驱 动 ,当然 ,正如 读者 想象 的 那样 ,除了 在 驱动 被 加 载 以 及 鲫 载 的 时 
候 能 够 打印 两 句 Hello 之 类 的 提示 语 之 外 ,这 个 驱动 不 做 任何 实际 意义 的 事情 。 

在 这 个 驱动 的 开始 有 三 行 include 的 指示 语 ,第 一 句 是 版 本 信息 。Linux 为 了 防止 不 同 版 
本 的 驱动 运行 于 不 被 支持 的 内 核 , 编 译 器 在 驱动 里 自动 增加 了 版 本 信息 ,所 以 驱动 中 必须 包含 
井 include <linux/version. h> 。 

后 面 两 个 include 头 文件 中 ,定义 了 与 模块 和 初始 化 相关 的 宏 。 也 就 是 在 程序 的 最 后 两 行 
里 所 写 的 : 


module_in 让 (Your_driver_initialization_ routine_address); 


module_exit (your _driver_exit_routine_address); 


读者 可 以 想像 到 ,module_init( ) ;和 module_exit( ) ; 才 是 驱动 的 真实 人 口 ,这 是 外 部 加 载 
器 需要 执行 的 函数 起 点 。 因 此 把 


int init_test_kernel_drv (void) ; 
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与 成 ， 役 
static :int init_test_kernel_drv (void) ; 武 
static void cleanup_test_kernel_drv (void); 软 

也 没有 关系 。 而 且 它们 的 名 字 也 是 任意 的 。 人 
Module_init( ); 和 module_exit ( ); 是 两 个 宏 ,它们 在 编译 为 内 核 驱动 或 作为 一 个 独立 的 | 计 

模块 驱动 这 两 种 情况 下 所 表示 的 意义 不 同 。 有 兴趣 的 读者 可 以 参考 “module. h” 和 "init,h" 两 | 之 


个 头 文件 自行 分 析 。 
为 了 把 这 个 简单 驱动 添加 到 系统 内 核 中 ,还 必须 把 这 个 文件 的 编译 增加 到 内 核 编译 的 系 | 与 
统 , 以 及 把 这 个 内 核 模块 增加 到 内 核 系统 里 。 下 面 的 步 又 说 明 如 何 修改 Makefile, 以 完成 这 些 | 方 
配置 步骤 。 为 此 还 得 为 这 个 内 核 模块 写 一 个 Makefile 脚本 ， 法 
人 149 


关 / 

# 目标 文件 列表 

obj -YY : = test_drvl1.o 

obj -am 有 

obj-n :; = 

OBJECT : = 

# 转 换 到 Rules,make 的 目标 列表 

O_TRARGET : = mydrv.o 

O_0BJS := SS(filiter- out $ (export -objs),$ (obj 一 六) 
0X_OBJS :; = $(filter S$ (export - objs),$ (obj -Y)) 
M_OBJS := $(filter 一 out $ (export -objs)，$ (obj 一 m)) 
MX_OBJS := 5$(filter $ (export - objs),，$ (Obj -mm)) 
MI_OBJS := 5$(filter-out $ (export- objs),，$ (obj 一 pn)) 


MIX_OBJS ;= 5$ (filter $S (export 一 objs),，S$ (Obj-- pn)) 

include ”8$ (TOPDIR) /Rules.make 

上 面 就 是 一 个 完整 的 Makefile 文件 , 除 此 之 外 ,为 了 让 编译 器 能 够 在 内 核 源 代码 树 里 自 
动 编译 到 这 个 文件 ,还 必须 把 这 个 驱动 的 源 文件 “test_drvl. c" 以 及 上 面 的 这 个 Makefile 复制 
到 /drivers/test_drv/ 目录 下 ,然后 修改 /drivers/Makefile, 即 drivers 目录 下 的 Makefile, 让 它 
编译 的 时 候 包 含 “test_drv” 这 个 目录 。 如 下 所 示 


-xx ， Drivers- 最 上 层 目 录 的 编译 脚本 (makefile) 
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x / 
# 这 儿 增 加 我 的 驱动 ,到 sub - dir 列表 的 最 后 

提 

Subdir -Y : = block char net parport sound miscN\test_drv 


注意 到 在 宏 subdir-y 的 末尾 增加 了 一 项 “test_drv” ,那样 编译 器 编译 到 /drivers/ 目 录 下 
的 Makefile 时 ,就 会 深入 到 /drivers/test_drv 目录 下 面 去 按照 /drivers/test_drv/Makefile 所 
定义 的 规则 执行 相关 的 编译 。 

由 于 在 /drivers/test_drv/Makefile 文件 中 指示 了 Obj 一 y := test_drv1l. o, 编译 器 会 根 
据 Rules. Make 中 定义 的 编译 规则 来 编译 test_drvl. c, 由 此 生成 test_drvl1. o。/test_drv/ 
Makefile 后 面 的 一 些 filter, 及 filter-out 宏 定义 将 过 滤 这 些 中间 目 标 文件 ,以 把 它们 加 到 合适 
的 模块 中 去 , 即 如 何 归 类 间 目 标 文 件 * . o. 。 

在 这 里 ,通过 修改 /drivers/ 目 录 下 的 Makefile, 可 以 让 编译 器 编译 test_drvl, c, 但 还 是 没 
有 解决 如 何 把 test_drvl.o 加 入 到 系统 内 核 之 中 的 问题 ,Linux 的 编译 环境 已 经 能 很 容易 地 添 
加 新 的 模块 到 一 个 系统 中 。 为 此 ,只 需要 在 根 目录 下 的 Makefile 里 为 test_drvl. o 增加 一 项 。 
如 下 所 示 ， 


关 / 

# 这 里 增加 我 的 驱动 文件 到 Linux 内 核 中 

提 

DRIVERS-YyY += drivers/ test_drv/test_drvl.o 


至 此 ,所 有 的 配置 工作 完 作 ,然后 转移 到 Linux 内 核 源 代码 的 根 目 录 下 ,执行 Make 即 可 。 

由 于 DRIVERS-y 宏 包 括 所 有 增加 到 系统 内 核 的 驱动 ,本 例 中 的 测试 驱动 就 会 被 编译 器 
自动 增加 到 内 核 。 把 新 的 Kernel 下 载 到 目标 板 , 重 新 启动 ,然后 就 可 以 在 人 Kernel 启动 信息 中 
看 到 下 列 字样 ,说 明 这 个 驱动 已 经 成 功 地 被 系统 内 核 加 载 。 


hello,worldi This is my kernel - mode cdriver 

同样 ,如 果 执 行 Kernel 的 Shutdown, 还 可 以 看 到 这 个 驱动 被 Linux 操作 系统 从 内 核 中 删 
除 ,这 个 时 候 可 以 看 到 : 

MY test kernel - mode driver Exits…byebyel 


尽管 这 个 驱动 很 小 ,但 由 于 是 内 核 驱 动 , 所 以 它 在 系统 内 核 的 整个 工作 生命 周期 内 都 一 直 
处 于 内 存 里 。 | 
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-个 二 淡 
6.2. 2 ”一 个 最 简单 的 模块 驱动 训 
式 
SS 软 
x* 文件 : modtst,c 和 件 
和 
* ”一 个 最 简单 的 模块 - 模式 的 Linux 驱动 的 例子 玉 
0 NS i 
是 
# include <linux/version.h> 想 
井 include ”<1inux/module.h> 与 
井 include ”<<linux/ ip 让 .hbh> 方 
include “< Linux/types.b> 法 
提 include ”<1inoux/pci.h>> 
int tkfunc(Cvoic) 了 5 
mn 七 __init init_mocule (void) 


{ 
Printfk(〈"\n hello， This is my module - mode driverNa "); 


//tkfunc( ); 


Teturn 0; 
} 


void ”exit cleanup_module (void) 


{ 
Printk("N\n MY test module - mode drjiver Exits… 1 N\n"); 


} 


int tkfuncGCvoicd) 
{ 


Struct “pci_dev x pdev = NULL; 
unsigned int VendorID， DeviceID; 
Tong ClassCcode， RMLliCode， NMemRddr; 


pdev = (struct pci_dev x* )pci_find_class(0x060000,pdev) ; 
证 (pdev 1= NULL) { 
printk ("\ndev:%XxNn"， pdev) 
Bci_read_config_dword(pdev ,0x00，,SR11Code) ; 
printk ("RALLCode: % xNn"， RLlCode); 
pci_read_config_dword(pdev,0x00,&VendorID);  。 
printk ("VendorID: % x\n"， VendorID); 
} 


return 0; 


1 
区 5 


和 


光村 
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} 


为 了 帮助 读者 熟悉 一 些 驱动 里 的 基本 调用 ,在 这 里 特意 添加 了 一 个 tkfun( 函数。 

另外 ,这 里 没有 使 用 上 一 小 节 讲 的 两 个 宏 : 

module_init (&… ) ; 

module_exit (8S… ) ; 
目的 是 让 读者 更 清楚 地 看 到 这 两 个 宏 展 开 时 的 真实 情况 。 

对 于 这 个 模块 ,同样 需要 写 一 个 Makefile 来 编译 这 个 模块 驱动 。 与 上 一 小 节 不 同 的 是 : 
在 上 一 小 节 使 用 了 系统 定义 的 Rules. Make, 而 里 面具 体 的 编译 规则 ,读者 是 看 不 到 的 。 在 这 
个 例子 中 , 写 出 了 完整 的 编译 规则 ,让 读者 了 解 编译 器 内 部 的 工作 情况 。 


/x------------ 


< Makefile 一 模块 - 模式 测试 驱动 的 编译 脚本 


关 / 

CC = mips_fp_le 一 gcc 

KERDEF = 一 DHODULE 一 D_KERNEL 一 DELINUX 

INSTRLL ”= /opt/hardhat/devkit/mjips/fp_le_target/usr 

MELRAGS ”= --D_KERNEL_ 一 I/mnt/hd2/ev_linx/include 一 WeLLAN\ 


一 Wstrict - prototypes -02 fonmit- frame- pointer N 
-G0 -mno-abicalls 一 fno-pic 一 mips2 一 了 和 八 
一 一 trap -pipt - DMODULE 一 mlong 一 calls 一 C 
instal1 : modtst,o 
pips_fp_le 一 ld -LI modtst.o 一 OmYtLSst 
install 一 由 755 mytst  $(INSTRALL)/binV/myhello 


modtst.o  : modtst.c 
$(CC) 8$CMEFLRGS) -osS@ $<< 
这 是 一 个 完整 的 Makefile, 其 中 的 语法 规则 这 里 不 作 全 面 介 绍 , 有 兴趣 的 读者 可 以 参照 


Make 了 解 每 一 个 语法 规则 。 首 先 ,CC,KERDEF 是 一 些 宏 定 义 。 其 中 INSTALL 定义 了 一 
个 网 络 文件 系统 里 的 一 个 目录 ,目标 开发 板 可 以 安装 这 个 目录 并 访问 ,如果 读者 的 目录 不 是 这 
个 ,请 修改 目录 路 径 。 

其 次 ,MFLAGS 也 是 一 个 宏 定 义 。 它 是 编译 modtst. c 时 要 用 到 的 一 些 编译 参数 。 读 者 
的 目标 开发 平台 与 这 里 介绍 的 可 能 不 一 样 ,一 个 简单 的 办 法 是 编译 一 下 内 核 ,然后 从 一 个 编译 
过 程 中 复制 编译 一 个 C 源 文 件 时 的 编译 参数 ,然后 作 一 些 删 减 即 可 。 这 里 是 以 ,mips2,mips_ 
fp_le 为 例子 的 ,mips2 表示 指令 集 , 一 le 表示 littlte endian 。 

注意 到 在 编译 时 的 命令 行 参 数 里 有 ， 
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一 D_KERNEL_，, 它 告诉 编译 器 ,这 个 编译 过 程 所 生成 的 目标 代码 是 作为 内 核 程序 使 
用 的 。 

一 DMODULE, 它 告诉 编译 器 ,这 个 驱动 是 采用 模块 加 载 的 方式 被 加 载 的 ,而 不 是 与 内 核 
绑 定 在 一 起 . 随 内 核 启 动 时 被 自动 加 载 的 驱动 。 

install ， modtst. o, 是 这 个 Makefile 的 起 始 编译 目标 。 注 意 到 在 连接 时 有 一 个 参数 
“一 rz, 它 告诉 连接 器 连接 时 不 要 汀 成 可 执行 式 的 文件 ,而 是 生成 一 个 可 重 定位 的 模块 ,以 备 
Insmod 可 以 加 载 它 。 

在 命令 行 中 运行 : 

$> 盖 make 

在 Make 的 过 程 中 ,Install 规则 已 经 将 所 生成 的 目标 代码 安装 到 : 

$(INSTALL)/bin/ 目 录 下 ,并且 重 命 名 为 : myhello。 

当 开 发 平台 启动 之 后 ,只 需 在 目标 平台 的 Linux Shell 下 运行 : 

&$ 盖 cd /usr/bin ;进行 到 模块 驱动 所 在 的 目录 


S$ 二 insmod . /myhel1lo 
$ Immod myhello 


其 中 :insmod 装载 这 个 模块 驱动 到 内 核 。 如 果 一 切 顺 利 的 话 ,这 时 可 以 看 到 如 下 提示 : 
hello， This is my module 一 mode driver 


当 . /myhello 被 加 载 到 系统 之 后 ,可 以 用 rmmod myhello 来 侦 载 这 个 模块 。 注 意 :外 载 
模块 时 不 能 指 路 径 , 只 需 指 明 模块 的 名 字 就 可 以 了 。 


6.2.3 Linux 驱动 中 注册 驱动 


在 前 面 几 个 小 节 的 讨论 中 ,通过 实际 例子 讲解 了 Linux 驱动 与 系统 的 接口 .编译 环境 以 及 
驱动 加 载 到 内 核 的 方式 与 过 程 。 在 本 小 节 中 ,将 进一步 考察 Linux 驱动 与 操作 系统 之 间 的 交 
互 方式 。 

正如 在 第 5 章 中 所 讨论 的 那样 ,Linux 也 需要 在 系统 中 注册 设备 驱动 。 对 于 字符 型 设备 
驱动 ,需要 在 init_module (〈 ) 函数 中 ,调用 register_chrdev( ) 来 向 内 核 和 注册 字 符 设备 。regis- 
ter_chrdev( ) 的 原型 定义 为 ， 

井 include<< 1inux/fs.h> 

砷 include<< linux/errno. h 盖 

int register_chrdev〈unsigned :int major,const char x* name,Struct file_operations x fops)， 

其 中 :Major 即 为 设备 驱动 程序 向 系统 申请 的 主 设备 号 ,如 果 为 0 则 表示 系统 为 此 驱动 程 
序 动态 地 分 配 一 个 主 设备 号 。Name 是 设备 名 ,这 个 名 字 应 该 与 /dev/ 目 录 中 定义 的 设备 名 一 


上 


罗 
二 
了 


本 
站 
后 


第 6 章 Linux 的 驱动 模型 


致 。fops 是 一 个 指向 文件 操作 例 程 函 数 表 的 一 个 指针 ,这 个 操作 例 程 函数 表 就 是 在 驱动 实现 
里 对 设备 执行 打开 关闭. 读 、 写 和 控制 等 操作 的 例 程 。 

此 函数 返回 0 表示 成 功 。 返 回 - EINVAL 表示 申请 的 主 设备 号 非法 ,一 般 来 说 是 主 设备 
号 大 于 系统 所 允许 的 最 大 设备 号 。 返 回 -EBUSY 表示 所 申请 的 主 设备 号 正在 被 其 他 设备 驱动 
程序 使 用 。 如 果 是 动态 分 配 主 设备 号 成 功 ,此 函数 将 返回 所 分 配 的 主 设备 号 。 如 果 register_ 
chrdev 操作 成 功 , 设 备 名 就 会 出 现在 /proc/devices 文件 里 。” 

由 此 看 来 ,Linux 的 驱动 登记 在 IO 核心 里 登记 了 主 设备 号 .设备 名 以 及 对 该 类 设备 进行 
操作 服务 的 函数 表 。 在 这 里 ,可 看 到 register_chrdev 仅 使 用 ( 仅 登 记 ) 了 16 位 整数 的 主 设备 
号 。 由 于 只 登记 了 主 设备 号 ,这 里 的 设备 名 是 代表 一 类 设备 。 驱 动 里 除了 主 设备 号 ,还 使 用 次 
设备 号 一 同 来 标识 单个 的 实际 物理 设备 。 操 作 系统 核心 (CO 系统 ) 仅 使 用 主 设备 号 来 定位 用 
户 的 Open 操作 到 特定 的 驱动 ,对 于 次 设备 号 ,只 是 原样 向 底层 驱动 传递 ,而 核心 从 来 不 关心 
也 不 使 用 次 设备 号 。 

下 面 小 节 进 一 步 讲解 主 设备 号 与 从 设备 号 。 


6.2.4 Linux 系统 中 的 设备 文件 


Linux 系统 里 的 设备 由 一 个 主 设备 号 (major number) 和 一 个 次 设备 号 (minor number) 标 
识 。 主 设备 号 唯一 标识 了 设备 类 型 , 即 设 备 驱动 程序 类 型 ;次 设备 号 仅 由 设备 驱动 程序 解释 ， 
以 支持 多 个 设备 实例 ,用 于 识别 同类 设备 中 不 同 的 IO 请 求 所 涉及 的 那个 设备 。 

细心 的 读者 可 能 已 经 发 现在 Linux 系统 中 ,没有 像 VxWorks 那样 通过 创建 设备 来 在 XO 
核心 建立 一 个 设备 链表 。 

事实 上 ,在 VxWorks 的 讨论 时 已 经 看 到 ,设备 链表 只 在 文件 的 打开 操作 时 被 引用 ,对 于 
后 续 操 作 并 没有 什么 大 用 。 它 主要 起 到 将 一 个 设备 文件 名 映射 到 一 个 驱动 的 作用 。Linux 采 
用 另 一 种 机 制 来 实现 这 一 过 程 ,这 就 是 设备 文件 。Linux 把 设备 文件 做 成 一 系列 静态 的 磁盘 
文件 ,存储 于 /dev/ 目 录 之 下 。 

值得 一 提 的 是 ,最 新 的 Linux 内 核 也 支持 在 操作 系统 运行 过 程 中 动态 创建 和 管理 设备 文 
件 , 即 DevFS (Device File - System) ,但 这 里 不 作 详 细 介 绍 , 有 兴趣 的 读者 可 以 参考 Linuz 
Deuice Drioers 一 书 。 


Linux 操作 系统 提供 了 一 个 工具 Mknode 来 生成 这 类 设备 文件 。MKknode 的 基本 用 法 是 : 
mknod [options ] name (bc major minor 
例如 ， 


5 cd /dev 
8 > mknod /dev/console C 5 1 
中 > mknod /dev/systty C 4 0 


第 6 章 Linuax 的 驱动 模型 攻 


$ mknod /dev/nuol1 C 2 3 

5$ 盖 mknod /dev/ram b I 1 

下 面 从 用 户 程序 的 调用 开始 ,来 讲述 应 用 程序 .驱动 和 设备 文件 是 如 何 关联 ,用 户 程 序 是 
如 何 通过 设备 文件 名 字 的 字符 串 找 到 相关 的 设备 ,进而 执行 设备 打开 操作 的 。 

有 了 设备 文件 ,在 用 户 以 设备 名 作 参 数 打 开 一 个 设备 文件 时 ,IO 系统 首先 找到 /dev 目 
录 下 的 设备 文件 ,通知 读 取 设 备 文件 中 的 信息 把 一 个 字符 串 的 设备 文件 名 映射 到 相应 的 设备 
。 然 后 再 通过 这 个 主 设备 号 以 
及 设备 类 型 在 系统 IO 核心 的 相应 表 中 ,找到 主 设备 号 所 对 应 的 驱动 。 当 然 前 提 是 ,该 设备 
驱动 已 经 被 加 载 。 如 前 一 小 节 所 述 ,驱动 加 载 初始 化 时 已 经 通过 调用 register_chrdev( ) ,对 
相应 的 主 设备 号 所 对 应 的 驱动 进行 了 注册 。 

小 结 : 

对 比 看 来 ,Linux 的 设备 文件 的 模型 ,更 体现 了 把 一 个 设备 当成 了 一 个 文件 , 即 设备 文件 。 
不 同 的 设备 如 果 特 性 很 类 似 , 可 以 使 用 同一 驱动 来 操作 ,这 时 ,只 需 在 使 用 Mknode 时 ,为 不 同 
的 设备 创建 主 设备 号 相同 而 次 设备 号 不 同 的 设备 文件 即 可 。 在 这 种 情况 下 ,注意 到 各 个 设备 
名 字 须 使 用 同一 样 的 名 字 前 绥 , 之 后 跟 一 个 数字 。 如 下 所 示 : 

mknod /dev/ $ {device}0 c $major 0 

mknod /dev/ $ {device}ti c S$major 1 


mknod /dev/ $ {device}2 c $major 2 
mknod /dev/ $ {device}3 c $major 3 


6.3 Linux 字符 型 设备 驱动 


字符 型 设备 与 流 式 设备 的 说 法 基本 类 似 。 对 它们 的 读 写 ,基本 上 是 定向 到 硬件 设备 。 读 
写 操作 都 是 顺序 的 ,不 能 随机 向 前 或 向 后 移动 文件 指针 。 而 块 设 备 恰 好 与 之 相对 ,针对 静态 存 
储 的 设备 而 言 , 对 它们 的 读 写 是 以 块 为 单位 的 , 且 可 以 随机 移动 读 写 指针 。 由 于 它们 的 数据 存 
储 容 量 一 般 都 很 大 ,所 以 对 它们 的 操作 一 般 都 通过 文件 系统 。 


6.3.1 驱动 的 加 载 与 清理 


当 引 导 系 统 时 ,内核 调 用 每 一 个 驱动 程序 的 初始 化 函数 。 它 的 主要 任务 之 一 是 调用 reg- 
ister_chrdev( ) 来 注册 驱动 。 

内 核 中 有 两 张 表 ,一 张 表 用 于 字符 设备 驱动 程序 , 另 一 张 用 于 块 设备 驱动 程序 。 这 两 张 表 
用 来 保存 指向 file_operations 结构 的 指针 ,设备 驱动 程序 内 部 的 函数 地 址 就 保存 在 这 一 结构 
中 。 内 核 用 主 设备 号 作为 索引 访问 file_operations 结构 ,从 而 访问 驱动 程序 内 部 的 设备 操作 
例 程 。file_operations 结构 定义 如 下 : 
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井 include<< linux/fs,.h> 
struct file_operations{ 
int(〈x 1seek) (struct inode x inode,struct file x* filpy,off_to ff,int pos); 
int (xx read) (struct inode x inode,struct file x* filp,char x buf,int count); 
int(〈x write) (struct inode x* inode,struct file x* filp,char x buf,int count); 
dint(〈x readdir) (Struct inode * inode,struct file x* filp,struct dirent # 寺 irent, int Count) 
int(〈(* Select) (struct inode * inode,struct file x* filp,int sel_type,select_table * wait); 
int(〈(* ioct1) (struct inode x inode,struct file x* filpyunsigned int cmd,unsigned int arg); 
int《〈# Immap) (void); 
int《〈x# open) 《Struct jinode * inode,struct file x* filp); 
Vold (:#* release) (struct inode #* inode,struct file 关 filp); 
int(〈x fsync) (struct inode #x inode,struct file xfilp); 
)} 


在 结构 file_operations 里 ,记录 了 设备 驱动 程序 所 提供 操作 例 程 的 地 址 , 简 述 如 下 : 

@ lseek 移动 文件 读 写 指针 的 位 置 ,显然 只 能 用 于 可 以 随机 存 取 的 块 设备 。 

G@ read 读 操 作 ,参数 buf 为 存放 读 取 数 据 的 缓冲 区 ,count 为 所 要 读 取 的 数据 的 最 大 长 
返回 值 为 负 表示 读 取 操 作 发 生 错 误 ,否则 返回 实际 读 取 的 字 节 数 。 

@ write 写 操 作 , 与 read 类 似 。 

由 readdir 取得 下 一 个 目录 人 口 点 ,只 有 与 文件 系统 相关 的 设备 驱动 程序 才 使 用 。 

@ select 驱动 提供 阻塞 等 待机 制 。 

@ ioctl 对 设备 的 配置 .控制 等 操作 ,参数 cmd 为 指示 所 有 操作 的 控制 命令 。 

(GD mmap 用 于 把 设备 的 内 容 映 射 到 地 址 空间 ,一 般 只 有 块 设备 驱动 程序 使 用 。 

open 打开 设备 准备 进行 IO 操作 。 返 回 0 表示 打开 成 功 , 负 数 表示 失败 。 

@ release 释放 设备 , 它 会 使 内 部 的 引用 计数 减 1, 如 果 设 备 的 引用 计数 减 到 0, 则 从 系 


统 中 删除 这 个 设备 。 


在 一 个 驱动 被 印 载 时 ,应 该 通过 在 clean_module( ) 函数 里 调用 unregister_chrdev( ) 来 从 


系统 删除 这 个 驱动 。 
6.3.2 中 断 的 申请 与 释放 


初始 化 部 分 还 负责 给 设备 驱动 程序 申请 系统 资源 ,包括 内 存 . 中 断 . 时 钟 和 IO 端口 等 。 


在 Linux 系统 里 ,对 中 断 的 处 理 属于 系统 核心 的 部 分 ,因此 如 果 设 备 与 系统 之 间 以 中 断 方式 进 
行 数据 交换 , 则 必须 把 该 设备 的 驱动 程序 作为 系统 核心 的 一 部 分 。 设 备 驱 动 程序 通过 调用 re- 
quest_ird 画 数 来 申请 中 断 ,通过 free_irq 来 释放 中 断 。 它 们 的 定义 为 : 


井 include<<linux/sched. h> 
typdef void (=* irq_handler)〈int irqyvoid x* dev_id,struct pt_regs x regs); 
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int request_irq (unsigned int irqy irq_handler handler,unsigned long flags,const char x device， 
void x* dev_ id); 


volid free_irq (unsigned int irqyvoid x* dev_id); 


参数 irq 表示 所 要 申请 的 硬件 中 断 号 。Handler 为 向 系统 登记 的 中 斯 处 理 例 程 , 它 的 函数 
类 型 是 Linux 系统 所 定义 的 标准 中 断 处 理 函 数 : 


typdef void (* irq_handler) (int irqyvoid x* dev_jd,struct pt_regs * regs); 


注意 到 中 断 登 记 时 传递 了 一 个 dev_id 的 指针 。 该 指针 将 在 每 次 中 断 时 当做 参数 传递 给 
中 断 例 程 , 它 是 与 设备 相关 联 的 私有 数据 。 驱 动 程序 的 设计 者 可 以 通过 这 一 机 制 向 中 断 处 理 
倒 程 传递 任意 想 要 传递 的 参数 。 

flags 用 于 设置 该 中 断 的 一 些 特性 ,例如 :快速 处 理 程序 (flags 里 设置 了 SA_INTER- 
RUPT) 还 是 慢 速 处 理 程 序 ( 不 设置 SA_INTERRUPT) ,快速 处 理 程序 运行 时 ,所 有 中 断 都 被 
屏蔽 ,而 慢 速 处 理 程 序 运 行 时 ,除了 正在 处 理 的 中 断 外 ,其 他 中 断 都 没有 被 屏蔽 。 在 Linux 系 
统 中 ,中 断 可 以 被 不 同 的 中 断 处 理 程 序 共 享 ,这 要 求 每 一 个 共享 此 中 断 的 处 理 程序 在 申请 中 断 
时 ,在 Flags 里 设置 SA_SHIRQ。 
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WinCE 的 驱动 模型 
7.1 WinCE 驱动 类 型 


WinCE 系统 整个 驱动 的 概况 如 图 7- 1 所 示 。 
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7-1 WinCE 驱动 内 部 框图 


由 图 7-1 中 可 以 看 出 , WinCE 的 核心 分 为 几 大 独立 的 系统 ,由 于 各 部 分 的 功能 不 同 , 所 


要 求 驱动 提供 的 接口 也 不 同 。 主 要 有 : 


GWES(CGraphics, Windows,Event Subsystem -图 形 窗口 事件 子 系统 ) 。 这 个 系统 为 用 户 
提供 窗口 消息 驱动 的 可 视 化 图 形 编程 接口 ,应 用 程序 使 用 GWES 提供 的 专门 API 进行 图 形 


化 接口 的 编程 。 
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另 一 大 类 是 由 Device Manager (设备 管理 器 ) 管 理 的 驱动 ,这 部 分 系统 有 点 像 前 面 讨 论 的 
IO 系统 , 它 管 理 流 式 字 符 型 设备 以 及 随机 存储 的 块 设备 。 

可 以 看 到 , WinCE 也 有 像 USB 这 类 的 总 线 设 备 驱动 , 除 此 之 外 ,在 图 7-1 上 没有 显示 出 
针对 网 络 编程 应 用 的 网 络 驱动 。 

WinCE 驱动 的 内 部 实现 有 两 种 层次 结构 。 一 种 是 单一 模式 ,一 种 是 两 层 结构 (MDD 十 
PDD) 。 对 于 后 一 种 情况 , WinCE 在 驱动 内 部 进一步 实现 软件 分 层 ,把 与 不 同 硬件 厂商 公用 的 
软件 ,主要 是 逻辑 结构 处 理 的 那些 功能 独立 出 来 ,作为 通用 的 实现 提供 给 OEM 驱动 开发 者 ， 
而 对 于 与 硬件 相关 的 部 分 则 使 用 PDD 来 实现 ,这 样 就 极 大 地 减轻 了 开发 驱动 的 工作 量 。 硬 件 
驱动 的 开发 者 只 需要 实现 那些 与 硬件 设备 相关 的 处 理 , 而 不 必 关 心 上 层 的 逻辑 实现 以 及 与 一 
些 复杂 协议 相关 的 软件 实现 。 


人 


下 面 着 重 考察 设备 管理 器 所 管理 的 那 部 分 驱动 。 因 为 这 部 分 驱动 与 前 几 章 讨论 的 模型 类 
似 , 所 以 通过 这 些 分 析 , 可 以 找 出 不 同 的 嵌 和 人 式 操作 系统 的 共性 ,认识 它们 本 质 的 相同 点 。 只 
要 掌握 了 其 实质 ,掌握 了 其 中 一 个 系统 ,其 他 的 系统 就 可 以 举一反三 ,自行 对 照 分 析 。 

在 本 节 中 ,重点 考查 Windows 注册 表 数 据 库 在 驱动 管理 中 的 作用 。 

由 前 面 的 讨论 可 知 ,VxWorks 依赖 于 I/O 系统 中 建立 的 驱动 表 (driver table) 以 及 设备 链 
表 (device list) 来 建立 用 户 程序 与 对 应 驱动 之 间 的 关联 。 为 此 驱动 必须 在 加 载 的 过 程 中 注册 
驱动 ,并 创建 设备 ,随后 应 用 程序 才 可 能 通过 系统 提供 的 open() 调 用 打开 一 个 设备 。 而 Linux 
只 在 系统 中 注册 驱动 ,在 驱动 表 里 包 含 了 主 设备 号 ,把 设备 的 信息 存放 在 磁盘 文件 系统 中 。 用 
户 程序 的 Open 调用 首先 通过 磁盘 文件 系统 中 的 设备 文件 转换 为 相应 的 设备 号 ( 主 设备 号 和 
次 设备 号 ) ,然后 由 IVO 系统 定位 到 相应 驱动 实现 的 实际 操作 ,随后 对 文件 的 操作 都 基于 文件 
描述 符 表 中 的 文件 号 。 

在 处 理 设备 名 字 与 驱动 的 关联 方面 , WinCE 则 依赖 于 注册 表 数 据 库 来 实现 。WinCE 使 
用 一 个 设备 名 字 前 级 来 定位 驱动 。 这 个 设备 名 字 前 缀 由 3 个 大 写字 母 组 成 ,不 同类 型 的 设备 
使 用 不 同 的 名 字 。 在 这 个 设备 名 之 后 可 以 跟 一 个 0 一 9 的 数字 ,所 以 WinCE 同一 个 驱动 最 多 
可 以 支持 10 个 设备 。 当 应 用 程序 使 用 一 个 设备 名 前 级 加 上 一 位 数字 后 缀 作为 设备 文件 名 试 
图 打开 一 个 设备 时 ,IXO 系统 中 的 设备 管理 器 就 在 注册 数据 表 中 搜索 ,找到 相应 的 注册 数据 表 
项 ,然后 根据 Dll 键 值 找到 相应 的 驱动 文件 ,如 果 这 个 驱动 库 还 没 加 载 到 系统 ,这 个 时 候 设 备 
管理 器 就 加 载 它 。 如 果 这 个 驱动 已 经 加 载 , 则 设备 管理 器 就 把 这 个 IO 请 求 定位 到 相应 的 驱 
动 上 。 应 用 程序 与 设备 驱动 的 交互 如 图 7-2 所 示 。 

由 此 看 出 , WinCE 没有 使 用 动态 注册 的 机 制 , 而 是 采用 静态 的 注册 数据 库 来 建立 设备 文 
件 与 设备 驱动 之 间 的 关联 。 
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的 Status DilEntry() fretum OK;} int main() 

1 TSD_open( ); { 

TSD_close(); fd = CreatFile( ATSD09; 

160 TSD read( ); DeviceIoControi(fd， 


TSD_write( ); 
TSD ioctl( ); 


SET_BLEN, 256)，; 
了 nm= ReadFile(ftd, bu 侍 nbytes); 
n= WriteFile( 亿 , bufft nbytes); 
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7-2 WinCE 系统 中 应 用 程序 与 设备 驱动 的 交互 
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第 三 篇 BSP/OAL 篇 


本 书 的 第 二 篇 详细 讨论 了 驱动 设计 的 模型 ,通过 第 二 篇 的 学 习 , 读 者 应 该 掌握 了 其 人 式 系 
统 软件 中 基础 模块 的 设计 方法 。 第 三 篇 中 将 讨论 整个 嵌入 式 系统 软件 平台 的 构造 方法 。 本 篇 
将 详细 介绍 板 级 支持 包 开 发 中 的 核心 设计 元 素 , 通 过 对 这 些 核心 元 素 设 计 的 介绍 ,读者 可 以 举 


反 三 理解 整个 系统 台 的 移植 与 了 发 。 
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BSP 的 基本 概念 


BSP 全 称 叫 板 级 支持 开发 包 (Board Support Package) 。 板 级 支持 包 , 顾 名 思 义 , 它 是 为 目 
标 板 运 行 某 个 笠 人 操作 系统 平台 所 提供 的 基本 软件 支持 包 。 为 了 和 弄 清楚 BSP, 先 看 看 BSP 与 
Drivers 之 间 的 联系 与 区 别 。 


8.1 BSP 与 驱动 


人 们 经 常 谈 到 BSP 与 驱动 (driver), 这 二 者 有 什么 区 别 与 联系 呢 ? 首先 ,BSP 是 一 个 体现 
操作 系统 设计 分 层 的 概念 。 一 般 情况 下 , 艇 人 式 操作 系统 (如 :VxWorks,Linux WinCE) 供 应 
商 ,他 们 提供 和 维护 了 操作 系统 核心 , 即 :那些 公共 的 .与 设 备 无 关 的 中 间 层 系统 代码 。 由 于 每 
个 硬件 平台 所 使 用 的 SoC 芯片 不 同 ,每 个 厂商 选择 的 外 围 器 件 以 及 电路 板 的 连接 和 配置 的 不 
同 ,那么 不 同 开发 板 或 是 不 同 产品 所 使 用 的 软件 就 会 千差万别 。 

BSP 就 是 为 了 在 财 和 设备 上 运行 通用 的 操作 系统 平台 ,针对 特定 的 硬件 平台 所 开发 的 支 
持 (Csupporting) 软 件 。 将 这 部 分 专用 软件 集成 到 希望 运行 的 操作 系统 核心 ,就 可 以 构建 一 个 
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完整 的 .运行 于 目标 板 上 的 代入 式 操作 系统 。 

简单 地 说 ,BSP 就 是 为 了 在 特定 的 硬件 平台 上 实现 一 个 特定 的 做 人 式 操作 系统 所 必须 实 
现 的 底层 软件 包 。 这 个 软件 包 里 包含 了 完整 的 .启动 运行 一 个 嵌入 式 操 作 系统 所 必须 的 程序 ， 
包括 最 基本 的 系统 管理 ,整个 系统 的 资源 分 配 与 管理 以 及 最 小 的 输入 /输出 设备 的 驱动 的 集 
合 。 例 如 :必需 的 定位 点 或 键盘 输入 设备 .显示 输出 设备 的 驱动 ,DMA 的 管理 程序 ,中 断 管 
理 . 电 源 管理 .总线 驱 动 和 存储 设备 驱动 等 。 由 此 看 来 ,BSP 里 面包 含 很 大 一 部 分 驱动 ,它们 
是 构成 一 个 相对 实用 的 OS 所 必 不 可 少 的 。 除 了 BSP 里 面 所 包含 的 基本 驱动 模块 之 外 ,还 需 
要 一 些 可 选 的 外 围 设备 的 驱动 ,或 是 第 三 方 软件 硬件 的 支持 , 即 插 即 用 的 支持 ,从 而 对 基本 的 
操作 系统 平台 的 工作 能 力 加 以 扩展 。 这 部 分 设备 驱动 程序 ,或 是 第 三 方 软件 可 以 独立 于 基本 
的 操作 系统 平台 ,可 以 分 立 单 独 开发 ,可 以 把 这 些 驱动 看 做 是 对 于 基本 操作 系统 实现 的 扩展 。 

由 此 看 来 ,如 果 要 对 BSP 与 Driver 有 所 区 分 的 话 , 那 就 是 BSP 包含 了 OS 正常 运行 所 必 
须 的 驱动 (driver) ,而 Driver 是 对 BSP 的 进一步 扩展 。 总 之 , 板 级 支持 包 和 设备 驱动 都 是 构建 
一 个 嵌入 式 软件 产品 所 必须 的 系统 软件 。 
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概括 说 来 ,BSP 所 实现 的 功能 包括 但 不 限于 以 下 功能 : 

二 系统 的 启动 与 初始 化 ; 

国 底层 硬件 的 IO 访问 ; 

图 系统 资源 的 重 上 映射 与 分 配 管理 ; 

图 系统 内 存 (DRAM, 或 DDR) 控 制 器 的 初始 化 ; 

硬 CPU 时 钟 ,Cache 的 管理 ; 

国 中 世 的 分 配 与 管理 ; 

国 与 CPU 相关 的 ,中 断 的 处 理 , 异 常 的 处 理 , 虚 拟 内 存 的 管理 ; 
国 DMA 的 管理 与 驱动 ,时 钟 中 断 的 处 理 ; 

罚 总 线 驱动 ,UART 串口 ,常用 于 调试 ,键盘 ,显示 屏 等 的 驱动 ; 
田 Boot - loader ,用 于 启动 系统 ,下 载 ,以 及 加 载 操作 系统 内 核 。 
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BSP 的 设计 要 索 


在 这 一 章 里 ,将 讨论 BSP 设计 中 的 一 些 基 本 要 素 。 由 于 BSP 设计 所 涉及 到 的 概念 非常 庞 
大 ,要 实现 的 功能 也 非常 多 ,各 个 系统 所 包含 的 硬件 和 软件 组 件 都 千差万别, 限于 能 力 和 经 验 
的 限制 ,笔者 不 可 能 对 所 有 软件 元 素 都 一 一 分 析 。 本 章 中 将 以 中 断 的 处 理 . 异 常 的 处 理 和 设备 
的 访问 ,以点带面 地 讲解 如 何 设计 系统 程序 。 

对 于 BSP 设计 中 所 要 遇 到 的 外 围 设备 的 驱动 设计 ,第 二 篇 中 所 讲 的 驱动 模型 ,在 BSP 设 
计 中 同样 适用 。 如 前 所 述 ,BSP 中 也 包含 了 大 量 最 基本 的 设备 驱动 。 

除了 这 些 最 基本 的 设备 驱动 外 ,BSP 中 主要 要 考虑 的 是 整个 系统 资源 的 配置 与 管理 。 各 
个 系统 硬件 资源 不 一 样 ,初始 化 的 方式 也 不 一 样 。 读 者 在 实际 开发 中 ,应 该 结合 硬件 资料 , 参 
照 8. 2 节 中 所 介绍 的 BSP 的 开发 任务 逐步 实现 所 有 的 软件 功能 。 


9.1 中 断 处 理 


设备 中 的 一 个 重要 机 制 是 使 用 中 断 , 中 断 在 大 多 数 设备 中 都 被 使 用 。 驱 动 中 的 一 个 重要 
工作 就 是 中 断 到 来 后 的 事务 处 理 。 

图 9-1 显 示 了 一 个 完整 的 中 断 处 理 的 框架 。 由 前 面 的 讲述 可 知 , 在 驱动 的 初始 化 过 程 
中 ,需要 注册 中 断 处 理 向 量 。 一 个 系统 的 中 断 向 量 表 至 少 会 有 两 项 ,第 一 项 是 索引 ,第 二 项 是 
中 断 处 理 例 程 的 人 口 。 这 个 中 断 向 量 表 应 该 位 于 BSP 中 , 它 属于 kernel 的 一 部 分 。 中 断 处 理 
例 程 就 是 一 个 回调 函数 , 当 有 对 应 于 某 个 设备 的 硬件 中 断 到 来 时 ,BSP 的 总 控 中 断 处 理 例 程 
就 会 调用 这 个 回调 函数 。 


9.1.1 物理 中 断 号 与 逻辑 中 断 号 


物理 中 断 号 是 与 中 断 控制 器 相关 联 的 。 在 没有 中 断 控 制 器 扩展 的 情况 下 ,它们 就 是 CPU 
所 能 处 理 的 硬件 中 断 。 现 代 的 SoC 系统 中 ,外 部 设备 很 多 ,所 以 往往 都 需要 中 断 控制 器 对 
CPU 的 中 断 作 扩展 。 

那么 为 什么 还 要 有 一 个 逻辑 中 断 号 呢 ? 其 原因 是 ,在 一 些 复杂 系统 中 ,有 一 些 中 断 是 复 用 
的 ,在 这 个 时 候 , 一 个 物理 中 断 线 ( 在 中 断 控制 器 中 进行 扩展 之 后 的 中 断 线 ) 仍 然 可 以 对 应 两 个 
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Driver 


DevEIE static 和 VENT intEvt; 


Devl_Handir DRV1 _Iinitialize () 


Se IntConnect(SysDev1， 


人 下 Devl_Handln; 
! InitializeEvent(&cintEvt); 
CreatThread(Dev1_Thread); 
} 
OEM _IntHandle() 


/ kernel cbntext 
Devl_Hapdtr () 


QueryIntCtirStatus (); 
Get Phys_Int_Souice; 半 CleagIWHintSource(); 
MapToSysIntNo(&SysjintD); | 上 | 。 GivqEvent (&intEv0; 
ObtainDevIntHandlerG); ) ; 
Look up _SysInt 蝎 ctTablef 
Goto DevintHandlerD); 字 Devl_Handlr() 
goto Devl_Handlr; 


4 和 
/iaser coOntext “ 


} while (1){ 
WaitForEvent(4intEvt); 
DoActualWork( ); 

} 

} 


图 9-1 驱动 程序 中 完整 的 中 断 处 理 架 构 

或 两 个 以 上 的 设备 。 例 如 :PCI 总 线 上 的 设备 ,其 中 断 线 就 是 可 以 复 用 的 。 

在 中 断 复 用 的 情况 下 ,仅仅 使 用 物理 中 断 来 区 分 不 同 的 中 断 处 理 例 程 是 不 够 的 。 当 然 , 如 
果 系 统 中 从 来 没有 中 断 复 用 的 情况 ,那么 可 以 把 逻辑 中 断 号 定义 为 与 物理 中 断 号 一 样 。 

在 SoC 系统 中 ,物理 中 断 用 来 区 分 硬件 设备 产生 的 中 断 源 。 而 逻辑 中 断 则 是 用 来 登记 和 
区 分 设备 的 中 断 处理 例 程 。 所 以 在 注册 中 断 时 ,必须 使 用 逻辑 中 断 号 ,这 是 在 BSP 的 OAL 开 
发 包 中 定义 的 。 在 驱动 开发 时 ,需要 查询 BSP 设计 文档 ,以 寻求 开发 的 设备 所 使 用 的 逻辑 中 
断 号 ,而 不 是 通过 查询 物理 中 断 号 来 注册 中 断 。 

操作 系统 内 核 提供 了 从 逻辑 中 断 号 到 物理 中 断 号 的 映射 。 


9.1.2 CPU 中 断 与 中 断 控制 器 扩展 


上 面 的 讨论 中 谈 到 了 中 断 控制 器 的 扩展 。 对 于 一 个 SoC CPU , 它 往 往 有 一 个 或 多 个 硬件 
中 断 输 入 。ARM 有 一 个 IRQ, 有 一 个 FIRQ。 而 MIPS 有 8 级 外 部 中 断 , 但 其 中 的 两 个 保留 
为 软 中 断 使 用 ,因此 外 部 真正 能 使 用 的 硬件 中 断 只 有 6 个 ,它们 是 可 以 设置 优先 级 的 ,有 些 


MIPS 的 处 理 器 又 扩展 了 8 个 硬件 中 断 线 , 这 些 硬件 中 断 线 是 直接 连 到 到 CPU 的 ,所 以 它们 
的 处 理 速度 非常 快 。 在 MIPS 架构 里 ,时 钟 中 斯 就 是 连接 到 CPU 的 中 断 上 的 。 

对 于 每 一 个 CPU 中 断 输入 线 ,CPU 内 部 都 有 相应 的 中 断 允 许 位 以 及 中 断 屏蔽 位 来 对 外 
部 中 断 的 输入 进行 允许 与 屏蔽。 但 值得 注意 的 是 ,中 断 的 允许 与 屏蔽 只 是 隔离 了 中 断 源 向 
CPU 请 求 中 断 , 它 并 不 能 阻止 一 个 设备 向 外 产生 中 断 请 求 。 所 以 当 系 统 处 于 初始 化 引导 过 程 
中 ,一 旦 打开 中 断 允 许 , 这 个 时 候 如 果 有 某 个 设备 有 等 待 中 断 服务 的 请 求 , 则 中 断 会 立即 传递 
到 CPU, 因此 在 早期 系统 的 初始 化 过 程 中 ,CPU 的 中 断 允 许 位 一 直 需 要 禁止 。 

对 于 CPU 的 每 一 个 中 断 输 入 线 ,CPU 内 部 都 有 一 个 中 断 矢量 ,一 旦 对 应 的 中 断 到 来 ， 
CPU 的 控制 就 会 自动 跳 转 到 中 断 向 量 对 应 的 中 断 处 理 例 程 , 而 无 需 由 CPU 执行 一 条 跳 转 指 
令 .。 在 BSP 中 ,需要 做 的 工作 就 是 在 所 有 CPU 的 中 断 向 量 里 填 人 正确 的 入 口 函 数 的 地 址 。 

可 以 把 CPU 的 中 断 输入 线 理解 为 一 级 中 断 , 而 通过 中 新 控制 器 扩展 的 中 断 输 入 线 理解 
为 二 级 中 断 。 一 个 中 断 控制 器 的 中 断 请求 输出 将 会 连接 到 CPU 中 断 输 入 线 中 的 某 一 个 。 


9.1.3 中 断 源 的 查找 


当 CPU 接收 到 外 部 中 断 之 后 ,在 中 断 处 理 例 程 中 ,应 该 检测 CPU 的 状态 寄存 器 , 如 
STATUS 或 CAUSE 寄存 器 ,以 确定 是 娜 条 中 断 线 上 引起 的 硬件 中 断 。 

如 果 某 个 CPU 中 断 对 应 的 是 多 个 实际 的 物理 中 断 ( 例 如 是 通过 中 断 器 扩展 的 中 断 , 或 是 
一 个 复 用 了 的 中 断 。) 这 时 CPU 无 法 知道 究竟 是 哪 一 个 设备 产生 的 中 断 。 针 对 这 两 种 情况 ， 
BSP 中 有 两 种 处 理 方 式 : 

人 如 果 使 用 了 中 断 控制 器 扩展 , 则 在 中 断 处理 例 程 中 ,需要 检查 中 断 控制 器 的 状态 寄存 
器 ,以 确定 中 断 源 。 

@ 如 果 是 中 断 复 用 ,在 没有 状态 寄存 器 可 以 查找 时 ,一 个 解决 的 办 法 就 是 把 连接 到 这 条 
中 断 线 上 的 所 有 中 断 回调 函数 都 依次 调 一 次 。 

在 后 一 种 情况 下 , 当 一 个 驱动 的 中 断 处 理 例 程 被 调用 执行 时 ,并 不 一 定 是 这 个 设备 真正 产 
生 了 中 断 。 对 于 这 种 情况 ,只 需要 忽略 这 次 调用 。BSP 的 集中 控制 处 理 函 数 会 继续 尝试 调用 
另 一 个 驱动 的 中 断 回调 例 程 。 所 以 ,为 了 保险 起 见 , 在 一 个 驱动 的 中 断 处 理 例 程 中 ,经 常 检 查 
自身 设备 是 否 产生 中 断 是 一 个 很 好 的 习惯 。 

总 之 ,中 断 源 的 查找 是 从 CPU 的 中 断 状态 寄存 器 开始 ,一 直到 中 断 扩展 控制 器 的 状态 寄 
存 器 的 层 层 查找 , 遇 到 中 断 复 用 的 情形 ,真实 中 断 源 的 确定 , 则 留待 驱动 去 确认 , 以 判断 是 不 是 
自身 设备 所 产生 的 中 断 。 

一 旦 获得 了 物理 中 断 源 , BSP 内 部 就 会 把 它 转 换 到 相应 的 逻辑 中 断 , 将 这 个 逻辑 中 断 号 
作为 索引 去 查找 系统 的 中 断 向 量 表 , 获 取 驱 动 注册 中 断 请 求 时 提供 的 入口 函数 的 地 址 ,从 而 控 
制 转移 到 相应 的 处 理 函 数 。 
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9.1.4 中 断 处 理 线 程 


在 上 面 的 驱动 框架 中 可 看 到 ,在 驱动 的 初始 化 例 程 中 ,创建 了 一 个 内 核 线程 。 在 这 个 线程 
中 等 待 设备 中 断 事件 的 产生 。 中 断 事件 是 由 中 断 处 理 例 程 所 产生 的 。 

为 什么 要 使 用 这 种 结构 呢 ? 其 主要 原因 是 :由 于 中 断 机 制 是 实时 系统 的 枢纽 ,在 中 断 处 理 
例 程 中 尽量 做 快速 .短暂 的 处 理 , 而 把 占用 时 间 较 长 的 繁杂 处 理 放 到 一 个 线程 的 上 下 文 。 在 一 
些 系统 中 ,中 断 舱 套 是 不 允许 的 ,或 是 实现 起 来 很 复杂 的 。 如 果 对 于 一 个 设备 的 服务 需要 占用 
很 长 的 时 间 去 处 理 , 就 会 延迟 藤 入 式 实 时 系统 对 于 系统 中 其 他 紧要 服务 响应 ,这 对 于 实时 系统 
来 说 是 不 允许 的 。 

举例 说 :一 个 网 卡 接收 到 了 一 个 很 大 的 数据 包 , 驱动 程序 中 需要 对 这 个 数据 包 进 行 复 制 。 
更 有 甚 者 ,需要 对 这 个 数据 包 进 行 分 析 , 看 它 是 什么 样 的 包 , 是 不 是 传 给 这 人 台 主 机 的 ,最 后 需要 
把 有 用 的 数据 放 在 相应 的 队列 里 。 这 一 过 程 往往 需要 很 长 的 时 间 去 处 理 。 这 个 时 候 , 如 果 一 
个 中 断 服务 占用 很 长 的 时 间 ,那么 ,一 些 实 时 的 ,比如 实时 音频 或 实时 视频 ,或 是 实时 通信 就 得 
不 到 及 时 的 响应 ,造成 临时 的 断 续 。 

为 了 解决 这 个 问题 ,需要 把 服务 时 间 长 ,而 任务 不 是 很 紧要 的 处 理 放 在 一 个 线程 中 去 做 。 
以 便 及 时 响应 系统 中 的 其 他 中 断 或 是 运行 系统 中 优先 级 更 高 的 应 用 。 

在 线程 中 处 理 一 些 硬 件 事 务 的 另 一 个 好 处 是 ,由 于 它 处 在 一 个 线程 的 上 下 文 , 系 统 提供 的 
很 多 服务 例 程 都 是 可 以 使 用 的 。 


9.2 CPU 异常 


和 


初次 接触 系统 软件 的 工程 师 对 中 断 的 概念 比较 熟 , 但 是 对 于 异常 的 名 字 会 产生 一 种 错觉 ， 
或 是 一 种 丽 惧 。 其 实 这 里 所 谈 及 到 的 异常 与 应 用 程序 编程 中 遇 到 程序 执行 时 的 非法 操作 的 异 
常 是 完全 不 同 的 两 种 概念 。 

CPU 异常 (exceptions) 是 现代 SoC 系统 中 实现 操作 系统 的 必要 机 制 。 引 和 CPU 异常 的 
目的 是 为 了 系统 能 够 执行 某 种 特殊 任务 ,或 是 处 理 一 些 特殊 情况 (包括 出 错 的 情况 ), 需 要 由 
CPU 去 进行 于 预 ,从 而 保证 系统 能 正常 运行 ,保证 系统 的 完整 性 ,以 及 系统 对 外 部 事件 处 理 的 
并 发 性 。 

举例 来 说 ,一 部 分 程序 没有 被 装 人 内 存 , 当 CPU 进行 地 址 分 析 时 ,发 党 一 条 指令 或 是 一 
个 数据 没 法 被 装载 。 这 时 ,CPU 就 会 产生 一 个 异常 ,而 异常 的 处 理 需 要 由 控制 程序 来 完成 。 
CPU 异常 的 控制 程序 就 是 BSP 开发 人 员 所 要 实现 完成 的 那 部 分 异常 服务 程序 , 它 与 中 断 服 
务 程序 类 似 。 

CPU 异常 有 很 多 的 源 ,包括 上 面 讲 到 的 内 存 的 管理 ,以 及 TLB 进行 地 址 转换 时 未 命中 ， 
算术 运算 的 溢出 ,除数 为 0 的 溢出 ,IO 中 断 (也 可 以 认为 是 异常 的 一 种 ), 系 统 调用 ,不 支持 或 


第 9 章 BSP 的 设计 要 素 


是 无 法 正确 译 码 的 指令 ,电源 键 按 下 ,或 是 软件 的 复位 等 ,它们 都 会 导致 CPU 无 法 正确 执行 
当前 的 操作 ,CPU 控制 需要 转 和 人 异常 服务 程序 。 

当 产 生 异 常 的 时 候 ,CPU 会 搜集 异常 处 理 所 必 须 的 信息 ,禁止 新 的 硬件 中 斯 的 产生 ,保存 
当前 程序 执行 地 址 ,然后 将 控制 转 信 到 一 个 特定 的 异常 服务 程序 的 人 口 。 

异常 服务 程序 称 之 为 :Exception Handler, 它 首先 需要 保存 当前 程序 运行 的 工作 上 下 文 
(the context of the processor) ,包括 :程序 计数 器 ,CPU 当前 的 工作 模式 (如 :用 户 模式 ,或 是 
特权 模式 等 ), 中 断 的 状态 标识 (是 禁止 的 ,还 是 允许 的 ) 等 。 除 此 之 外 ,异常 处 理 程 序 还 需要 保 
存 异 常 处 理 过 程 中 需要 用 到 的 CPU 内 部 寄存 器 的 当前 值 , 如 果 需 要 调用 外 部 的 C 函数 或 是 
别 的 外 部 函数 ,最 好 是 将 所 有 的 寄存 器 的 值 都 保存 起 来 , 以免 函数 调用 的 时 候 被 破坏 。 

这 些 上 下 文 的 恢复 是 通过 执行 一 条 ERET(Exception Reset) 指令 来 完成 的 。 但 是 注意 
到 ,ERET 只 是 恢复 那些 CPU 状态 相关 的 上 下 文 , 对 于 诸如 通用 寄存 器 的 恢复 还 得 按 保存 时 
的 顺序 在 执行 ERET 之 前 手动 恢复 。 

当 异 常 处 理 完 成 返回 时 ,根据 异常 处 理 的 情况 以 及 异常 的 种 类 ,CPU 控制 返回 到 被 处 理 
过 的 后 一 条 指令 ,或 是 发 生 异 常 的 那 条 指令 继续 执行 。 

需要 指出 的 是 :中 断 是 CPU 异常 的 一 种 ,如 果 没 有 特别 的 说 明 , 在 下 面 的 讨论 中 异常 包 
含 了 中 断 ,中断 是 异常 的 一 种 特例 。 


9.2.1 异常 向 量 表 


本 小 节 以 MIPS 为 例 ,主要 说 明 蜡 常 的 处 理 原理 机 制 。ARM 体系 的 异常 处 理 与 之 类 似 ， 
读者 可 以 举一反三 地 进行 分 析 。 

在 MIPS 体系 中 ,异常 的 人 口 很 多 ,有 一 些 是 保留 的 ,其 和 人口 地 址 分 散在 0x400 字 节 的 地 
址 范围 。 而 ARM 的 异常 只 有 8 种 ,分 布 在 起 始 地 址 开始 的 56 字 节 。 

下 面 看 一 下 ,在 ROM 中 ,一 些 常见 的 异常 向 量 表 的 定义 : 


井 define RVECENT(f,n) \ 
b 上 nop 

井 define XVECENT(f,bev) \ 
b fy 11 k0,bev 


_FOmInjt: 
.Set DOoreorder 
RVECENT(__romInit,0) /x# Power-ON 入 口 点 x*/ 
omWarmInit: 
_IOmWarmInit， 
RVECENT(romReboot ,1) /* 软件 重启 (reboot)* / 
RVECENT(ITomReserved ,2) 
RVECENT(romReserved,3) 
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如 RVECENT(romReserved 4) 
大 RVECENT(romReserved,5) 
下 RVECENT(romReserved,6) 
软 RVECENT(romReserved,7) 
信 RVECENT(CromReserved:,8) 
反 RVECENT(ITomReserved,9) 
计 RVECENT(CromReserved,10) 
记 RVECENT(romReservedy11) 
起 RVECENT(romReserved,12) 
与 RVECENT(romReserved,13) 
广 RVECENT(romReserved ,14) 
了 RVECENT(romReserved,15) 
RVECENTIromReserved,16) 
168 RVECENT(romReserved,17) 
RVECENT(romReserved ,18) 
RVECENT(CromReserved,19) 


RVECENT(CromReserved ,20) 
RVECENT(romReserved, 21) 
RVECENT(romReserved,22) 
RVECENT(romReserved,23) 
RVECENT(romReserved,24) 
RVECRNT(CromReserved ,25) 
RVECENT(romReserved,26) 
RVECENT(romReserved,27) 
RVECENT(romReserved ,28) 
RVECENT(IomReserved ,29) 
RVECENT(IomReserved,30) 
RVECENT(romReserved ,31) 
井 让 (CPU == R3000) 
XVECENT(romExcHandje,0x100) / * bfc00100: R3000 UTLB 错失 的 庙 量 * / 
井 else 
RVECENTCromReserved,32) 
井 endift  /* CBEU == R3000 x/ 
RVECENT(romReserved,33) 
RVECENT(romReserved ,34) 
RVECENT(romReserved,35) 
RVECENT(CromReserved,36) 
RVECENT(romReserved,37) 
RVECENT(rcmReserved,38) 
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< 
3 


RVECRENT(CromReserved,39) 
井 主 (CEU == R33000 || CPU == R33020) 
XVECENT(romExcHandle,0xl40) / * bfc00140: LR330x0 调试 的 向 量 * / 
井 else 
RVECENT(romReserved ,40) 
#endif  /:* CPU== R33000 || CPU == R33020 * / 
RVECENT(TomReserved,41) 
RVECENT(romReserved,42) 二 
RVECENT(romReserved,43) 水 村 
RVECENT(romReserved,44) - 洒 
RVECENT(romReserved,45) 订 
RVECENT(romReserved ,46) 法 
RVECENT(IomReserved,47) 
井 证 (CPU == R3000 | | CPU == R33000 || CPU == R33020) 了 69 
XVECENT(romExcHandle,0x180) / x* bfc00180: R3000 一 般 异 常 的 向 量 * / 
井 else 
RVECENT(romReserved ,48) 
#endif  /x* CPU == R3000 || CPU == R33000 || CPU == R33020 x / 
RVECENT(romReserved ,49) 
RVECENT(zomReserved,50) 
RVECENT(romReserved,51) 
RVECENT(romReserved,52) 
RVECENT(romReserved,53) 
RVECENT(romReserved,54) 
RVECENT(zomReserved,55) 
RVECENT(romReserved,56) 
RVECENT(ronmReserved ,57) 
RVECRENT(romReserved,58) 
RVECENT(romReserved,59) 
RVECENT(romReserved,60) 
RVECENT(romReserved,61) 
RVECENT(romReserved ,62) 
RVECENTCromReserved,63) 
井 i (CEU == R4000) 
XVECENT(rcomExcHandle,0x200) / * bfc00200: R4000 TLB 错失 的 向 量 * / 
井 else 
RVECENT(romReserved,64) 
井 endif 
RVECENT(romReserved,65) 


芝 汪 > 


办 


iT 


二 
人 


本 Cs 
AP 


第 9 章 BSP 的 设计 要 素 


嵌 RVECENT(romReserved,66) 
和 RVECENT(CromReserved,67) 
式 RVRECENTCromReserved,68) 
软 RVECENT(romReserved ,69) 
人 RVECENT(romReserved ,70) 
近 RVECENT(romReserved,71) 
RVECENT(CromReserved,72) 
因 RVECENT(romReserved,73) 

杠 RVECENT(romReservedy,747) 
二 RVECENT(romReserved ,75) 

万 RVECENT(TOomReserved,76) 
法 RVECENT(romReserved,77) 
RVECENT(romReserved ,78) 

JI70 RVECENT(romReserved ,79) 


井 话 (CPU == R4000) 

XVECENT(romExcHandle,0x280) / * bfc00280: R4000 XTLB 错失 的 向 量 * / 

井 else 
RVECENT(romReserved,80) 

井 endif 
RVECENT(romReserved,81) 
RVECENT(romReserved,82) 
RVECENT(romReserved,83) 
RVECENT(romReserved,84) 
RVECENT(romReserved,85) 
RVECENT(romReserved ,86) 
RVECENT(romReserved ,87) 
RVECENT(romReserved ,88) 

旦 RVECENT(CromReserved ,89) 
RVECENT(romReserved,90) 
RVECENT(romReserved,91) 
RVECENT(romReserved,92) 
RVECENT(TOomReserved,93) 
RVECENT(romReserved ,94) 
RVECRENT(romReserved,95) 

# 证 〈(CPU == R4000) || (CPU == R4650) ) 
XVECENT(romExcHandle,0x300) / x* bfc00300:， R4000 缓存 (cache) 处 理 的 回 量 * / 

井 else 
RVECENT(romReserved,96) 
井 endif 
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RVECENT(romReserved ,97) 撒 
RVECENT(romReserved,98) 入 
RVECENT(romReserved ,99) 臣 
RVECENT(romReserved ,100) - 锭 
RVECENT(ronReserved,101) 人 
RVECENT(romReserved,102) 汗 
RVECENT(romReserved,103) 、 
RVECENT(romReserved,104) 更 
RVECENT(romReserved,105) 相 
RVECENT(romReserved ,106) .二 


RVECENT(romReserved ,107) 
RVECENT(romReserved ,108) 
RVECENT(romReserved,109) 
RVECENT(romReserved,110) 了 71 
RVECENT(romReserved ,111) 
# 证 ((CEU==R4000) || (CPU == R4650) ) 
XVECENT(romExcHandle,0x380) / * bfc00380: R4000 一 般 异 常 的 向 量 * / 
井 else 
RVECENT(romReserved ,112) 
井 endif 
RVECENT(romReserved ,113) 
RVECENT(romReserved,114) 
RVECENT(romReserved,115) 
RVECENT(TomReserved,116) 
RVECENT(romReserved,116) 
RVECENT(romReserved,118) 
RVECENT(zomReserved,1I19) 
RVECENT(romReserved ,120) 
RVECENT(romReserved,121) 
RVECENT(romReserved ,122) 
RVECENT(romReserved,123) 
RVECENT(romReserved ,124) 
RVECENT(romReserved,125) 
RVECENT(romReserved ,126) 
RVECENT(romReserved ,127) 


/x 假定 没有 别 的 保留 的 向 量 , 则 : 
x 128 x* 8 == 1024 == 0x400 
x* 因此 这 里 的 地 址 是 :R_VEC+ 0x400 == 0xbfc00400 
关 / 


mr 
Te 


了 
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括 虽然 上 面 的 写法 有 点 繁琐 ,但 它 帮助 读者 清楚 地 看 到 ROM 中 前 1 000 个 字 节 实际 上 是 
入 | “异常 和 中 断 向 量 的 人口 ,而 很 多 异常 的 入 口 是 被 保留 的 ,目前 MIPS 只 使 用 了 有 限 的 几 个 。 
了 | MIPS 保留 这 么 大 一 块 向 量 表 的 做 法 有 点 费解。 


: 惟 
件 下 面 看 一 个 比较 简洁 的 写法 : 
1 
议 , ent reSset_exception 
计 
- 光 TesSet_exceptaon: 
本 ,Set noreorder 
0 
昌 . Set noat 
了 D DPIestart # Reset 和 人 口 点 
， TOVe K0，zero 
AW 
b ”prestart 并 VxWorks 重启 (Reboot) 人 口 点 
moOVe 0，zerO 
中 提 ITTROM 第 二 个 人 口 点 
move K0，zero 


.Set reorder 


/* 上 电 启 动 的 异常 处 理 向 量 


关 / 
.Origin 0x100 /x bfc00100: r3000 UTLB 错失 x / 
x3k_utlb_bev 
. origin 0x140 /x* bfc00140: 1r33000 调试 * / 
1r33k_dbg_bev 
.Origin 0x180 /xx bfc00180: r3000 一 般 的 异常 * / 
I3k_gen_bev 
.Origin 0x200 /xx bfc00200: r4000 TLB 错失 x* / 
4k_t1lb_bev 
.Origin 0x280 /xx bfc00280; r4000 XTLB 错失 x/ 
rr4k_xt1b_bev 
.origin 0x300 / * bfc00300: r4000 缓存 (cache) 出 错 * / 
r4k_cache_bev 。 
.origin 0x380 / x bfc00380: r4000 一 般 的 异常 x/ 
4k_gen_bev 
.end TeSet_exception 


在 这 个 例子 中 ,注意 到 程序 里 面 有 很 多 伪 指 令 :. origin 0x???, 它 强制 下 一 条 指令 或 数 
据 从 相对 偏 移 为 “???” 地 址 开始 的 地 方 开 始 存放 。 而 对 照 MIPS 的 体系 架构 ,可 以 看 出 0x000 
的 位 置 就 是 Power - On Reset 的 起 始 入 口 ;* 同 样 ,0x100 是 TLB 未 命中 时 的 人 口 ,0xl180 是 一 
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般 异 常 的 入 口 ,0x300 是 cache 错误 。 同 样 还 看 到 R3000,R4000 系列 的 异常 人 口 有 一 些 差异 ， 


上 
区 


Cr 


而 在 这 一 个 表 中 都 可 以 统一 定义 。 入 
除了 在 这 里 定义 了 各 种 异常 的 人 口 表 之 外 ,这 段 代 码 的 前 面部 分 ,在 两 个 实际 异常 之 间 的 
空白 处 ,实际 上 还 可 以 放 和 其 他 指令 ,由 此 可 以 想象 ,对 于 快速 的 处 理 或 是 一 些 预 处 理 , 就 可 以 | 件 
放 在 中 断 向 量 表 的 空白 处 处 理 完毕 ,那样 的 好 处 是 不 用 保存 大 量 的 现场 ,不 用 进行 控制 跳 转 来 “| 设 
增加 额外 的 CPU 处 理 时 间 。 站 
和 
9.2.2 向 量 表 的 安装 相 
有 些 时 候 , 需 要 用 系统 中 新 的 异常 处 理 例 程 取代 老 的 处 理 例 程 ,这 时 就 需要 使 用 新 的 向 量 。 
去 覆盖 旧 的 向 量 ,或 者 是 如 上 一 小 节 所 述 ,直接 将 短小 的 异常 预 处 理 , 比如 说 将 异常 分 发 程序 | 注 
段 复制 到 CPU 的 向 量 表 。 如 下 代码 片段 所 示 : 
173 


.七 exXt 
AN 兴 兴 兴 关 关 基 其 关 其 尖 关 并 关 关 关 关头 凑 关 关 尖 并 关 关 关 器 关 关头 次 关 关头 关 尖 尖 尖 关 尖 次 其 尖 关 关 关 其 关头 尖 尖 闪闪 关 
x: testExcVecInt- 重 载 通常 的 异常 向 量 
共 
* 这 个 函数 在 excVecInit 被 调用 之 后 ,以 重 载 通常 
* 向 量 地 址 0x80000080 处 的 异常 处 理 程 序 。 
闪 / 
.glob] testExcVecInit 
,et testExcVecInit 
testExcVecInit， 
Subu sp,24 
Sw ray20(sP) 


la al0 ,testExcNormVec // 新 的 通用 处 理 一 数 - 源 地 址 

] al,E_VEC // 卫 VEC = 0x80000080 - 目标 地 址 
1w a2 ,testExCNormVecSize // 新 的 通用 处 理 下 数 的 长 度 

SI1 a2,2 

jal bcopyLongs // 复 制 

/ 


x x 使 指令 缓存 (ICache) 无 效 ,以 便 新 的 数据 在 下 次 异常 到 来 的 时 候 

x* x 可 以 被 当 作 指令 读 取 。 

关 / 

1i a0,E_VEC // 清 除 从 0x8000080 开始 的 一 段 的 指令 缓存 
TW al ,teSstRExCcNormVecSize 

jal cacheTextUpdate 


1w ra 20(sPp) 
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丛 addu sp,24 
人 Ia 
过 .end testExcVecInit 
间 A 
你 // 下 面 是 新 的 异常 处 理 函 数 的 例子 
设 W/ 关 关 关 兴 兴 关 关 关 关 关 尖 关 关 关 次 关 关 关 尖 关 关 尖 关 关 关 关 次 关 关头 关 关 关 关 关 关 关 基 并 凑 关 尖 关 关 关头 尖 关 次 关 关 闪闪 
注 x Volid testExcNormVec (〈) 
之 * 7/ 
渤 f 
相 .COmm SavedK1 ,4 
1 ,ent testExcNormVec 
.Set Doreorder 
法 . Set DoOat 
testExcNOrmVec : 
174 1】a k0 ,savedK1 
sw 。 kl,0(k0) // 询 产生 异常 的 原因 
mfc0 k0,C0_CRUSE /x grab cause register 关 / 
JTw Kk1 ,areWeNested /* grab value in delay slotx / 
andi k0 ,CRUSE_EXCMRSK / xx 1ook at exception bits x / 
bne k0 ,zeroy1f / x Zero == interrupt x / 
Dop 
la 。 k0,myExcIntStub // 跳 转 到 中 断 处 理 例 程 
]J K0 /xx jump to interrupt handler x/ 
Dop 
1， lw K1， savedK1 
la 。 k0,myExcStub // 跳 转 到 异常 处 理 例 程 
]J k0 / * jump to exception handler x / 
Dop 
上 testExcNormVecEnd ， 
.Set at 
.Set reorder 


.end testExcNormVec 


. Sdata 

testExcNormVecSize: // 计 算 异 常 分 发 处 理 程 序 的 长 度 
.WOTd testExcNormVecEnd - testExcNormVec 2 
,七 ex 

Linux 异常 的 初始 化 


接 下 来 看 一 下 Linux 操作 系统 中 异常 向 量 表 的 安装 过 程 。Linux 的 异常 向 量 的 初始 化 的 
和信 口 函 数 是 :trap_init( ) ,如 下 代码 片段 所 示 : 
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void _init trap_init(Cvoid) 


人 


extern Char except_vecl_generic,except_vec2_genericj 
extern char except_vec3_generic，except_vec3_r4000; 
exteImn Char exCcept_vec4; 

extern Char except_Vvec_ejtag_debugs; 

unsigned 1ong i; 


/* 一 些 固件 程序 没有 清除 BEV 标志 ,这 里 清除 它 * / 
Clear_cp0_status(ST0O_BEV) ; 


/* 复制 通用 的 异常 处 理 例 程 代 码 到 它们 最 终 的 异常 地 址 。* / 
memcpy((void x* )(KSEG0 + 0x80) ,&except_vecl_generic,0x80); 
memcpy((volid * )(KSEGO + 0xl00) ,Sexcept_vec2_generic,0x80); 
memcpYy((void x )(KSEG0 十 0x180) ,Sexcept_vec3_generic,0x80); 
flush_icache_range(KSEG0O + 0x80,KSEGO + 0x200)j; 
7/ 关 

* 设置 默认 的 中 断 向 量 

/7 
tor (= 031i<= 313 守 ++) 


Set_except_vector(1i,handle_reserved) ; 


/* 复制 ETaG 调试 异常 处 理 例 程 代码 到 它 最 终 的 异常 地 址 * / 
关 人 : 
if 〈mips_cpu. options & MIPS_CPU_EIJTRG) 
memcpy((void * )(KSEG0O + 0x200) ,Sexcept_vec_ejtag_debug,0x80); 


/x* 只 有 部 分 CEU 有 watch 异常 ,或 使 用 一 个 明确 的 中 断 向 量 * / 
关 / 


Watch_init(C); 


1/ 类 
x* 有 些 MIPS CPU 使 用 一 系统 明确 的 中 断 向 量 地 址 ,以 减少 
* 中 断 处 理 的 额外 开销 ,如 果 有 的 话 就 使 用 它们 。 
关 / 
if (mips_cpu. options & MIPS_CPEU_DIVEC) 《 
memcpYy((void * )(KSEGO + 0x200) ,Sexcept_vec4,8)3; 
Set_cp0_cause(CRUSEF _IV)7; 
》 
六 
* 有 些 CPU 可 以 使 能 /或 禁止 缓存 (cache) 的 极 性 ,但 是 它们 使 用 
x* 不 同 的 方式 。 
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加 

六 parity_protection_init(); 

2 set_except_vector(1,handle_mod); 
件 Set_except_vector(2,handle tibl); 
设 set_except_vector(3,handle tlbs); 
计 set_except_vector(4,handle_adel1); 
Set_except_vector(5 ,handle_ades); 
2 

起 人 

坷 * 数据 总 线 错 /指令 总 线 错 是 由 外 部 硬件 通知 的 ,所 以 这 2 个 异常 
方 * 有 板 级 特定 的 向 量 。 

波 关 / 

Set_except_vector(6,handle_ibe) ; 

了 76 set_except_vector(7,handle_dbe); 


ibe_board_handler = default_be_board_handler; 
dbe_board_handler = default_be_board_handler; 


Set_except_vector(8,handle_sVYs); 
Set_except_vector(9 ,handle_bp); 
set_except_vector(10 ,handle_ri); 
Set_except_vector(11,handlje_cpu) ; 
Set_except_vector(12 ,handle_ov); 
Set_except_vector(13,handle_tr); 


if (mips_cpu. options & MIPS_CEU_FPU) 
Set_except_vector(15,handje_fpe); 
ifE (mips_cpu. options & MIPS_CPU_MCHECK) 
Set_except_vector(24,handle_mcheck); 
} 


有 了 上 面 的 分 析 , 这 段 代 码 的 意图 应 该 很 清楚 ,在 此 不 在 装 述 。 在 这 里 , 主要 关注 类 似 于 ， 


Set_except_vector(1,handle_mod) ; 

Set_except_vector(2 ,handle tlbl); 
Set_except_vector(3,handle tlbs); 
Set_except_vector(4,handle_adel); 
Set_except_vector(5 ,handle_ades) ; 


的 代码 。 它 们 安装 异常 处 理 的 矢量 , 即 是 说 把 异常 处 理 函 数 的 和 人口 地 址 逐个 填写 到 CPU 规 
定 的 异常 产生 时 CPU 的 起 始 执行 地 址 。 
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9.2.3 异常 处 理 代码 实例 


本 小 节 以 中 断 作 为 例子 ,分 析 在 一 个 实际 的 Linux 中 , BSP 底层 中 断 的 分 发 及 处 理 的 完 
整 过 程 。 

下 面 的 例子 是 使 用 ITE 公司 的 IT8172G 中 断 控制 器 。 通 过 这 个 例子 ,读者 可 了 解 底 层 中 
断 的 处 理 .中 间 层 的 派发 以 及 上 层 (Driver 级 ) 的 处 理 。 

图 9-2 显示 了 IT8172G 中 断 控制 器 的 内 部 框图 ,关于 IT8172G 以 及 其 中 断 控制 器 的 详 


0 上 


9-2 IT8172G 中 断 控制 器 内 部 框图 


IT8172G 中 断 控制 器 外 部 可 以 接 大 量 中 断 源 ,大体 上 分 成 4 组 ,一 组 是 Local Bus Device 
中 断 源 ; 第 二 组 是 LPC 设备 ;第 三 组 是 PCI 设备 ;第 四 组 是 非 屏蔽 中 断 (NMD) 。 

在 内 部 ,IT8172G 中 断 控制 器 有 多 组 寄存 器 来 设置 各 个 中 断 源 的 触发 模式 (trigger 
mode), 有 逐个 允许 或 禁止 的 中 断 屏蔽 寄存 器 以 及 中 断 请 求 寄 存 器 。 后 者 指示 了 当前 外 部 有 
哪 一 个 ,或 是 哪 几 个 中 断 源 发 出 了 中 断 请 求 。 

在 IT8172G 中 断 控 制 器 的 输出 端 ,IT8172G 将 所 有 的 可 屏蔽 中 断 的 请 求 连接 到 CPU 的 
INT0# 号 中 断 输入 线 , 而 把 IT8172G 的 非 屏 项 中 断 的 输出 连接 到 CPU 的 非 屏 蔽 中 断 的 输 
人 线 。 

下 面 看 具体 的 代码 实现 。 


Se 
Sr 
> 


RE 
人 
人 PP 


ai 


下 信 : 
证 六 


二 
四 区 


| 人 
PS PT 
人 


> 
六 
六 
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文件 int - handler.S 是 中 断 处 理 中 low -~ level 级 别 的 处 理 , 即 中 断 到 来 时 ,CPU 最 先 执 
行 的 处 理工 作 。 

关头 闪闪 其 尖 类 关 凑 关 关 关 关 凑 尖 关 其 尖 关 尖 关 关 尖 关 关 凑 关 关 关 尖 凑 关 关 并 尖 关 关 关 关 关 并 其 尖 关 关 尖 关 关 关 凑 关 关 关 关 其 关 次 关 关 

x int- handler.S 

闪闪 关 凑 兴 尖 关 关 关 尖 尖 关 关头 闪闪 基 关 凑 尖 关头 关 尖 关 关 关头 其 关 关 关 关 关 关头 尖 关 尖 关 其 尖 关 关 尖 关 关 关 关 居 尖 关 关 产 关 关 其 关 A 

井 include <asm/asm.h> 

# include <<asm/mipsregs.h> 

划 include <asm/regdef.h> 

井 include <<asm/stackframe. hb 


.七 ex 

,Set macroO 
. Set Doat 
,align 5 


NESTED(it8172_IRQ,PT_SIZE,sPp) 
SRVE_RALL 
CLI 井 Important :mark KERNEL mode ! (标识 内 核 模 式 ) 
/x 在 此 处 必须 设置 成 reorder = / 


关 


* 获取 等 待 中 的 中 断 


x</ 
mfc0 t0,CP0_CRUSE # get pending interrupts( 获 取 等 待 中 的 中 断 ) 
mfc0 tl,CP0_STRTUS # get enabled interrupts( 获 取 人 允许 的 中 断 ) 
and t0 ,tl1 isolate allowed ones( 同 离 允 许 的 那些 中 断 ) 
andi t0,0xff00 # isolate pending bits( 隔 离 等 待 中 的 那些 中 断 ) 
beqz ， t0 , 3 开 # spurious interrupt( 未 知 的 中 断 ) 
andi a0 ,t0 ,CRUSEE_IP7 
beq a0,zeroy 1f 
moVve a0,SP 
jal local_timer_interrupt 
j ret_from_irq 
nop 
T: 
andi a0 ,t0,CRUSEF_IP2 # 这 里 仅 剩 下 期 待 处 理 的 中 断 
bed a0,zeroy3f 
move a0，,SP 


jal it8172_hw0_irqdispatch 
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mfc0 t0 ,CP0_STRTUS 井 禁止 中 斯 


OFiIi t0 ,1 

XOLIL 七 0 ,1 

mtc0 t0,CP0_STRATUS 

nop 

Dop 

nop 

1a Bl， ret_from_ irq 

诺 al 
nop 

3: 

IOVe a0 ,SP 

jal mips_Spurious_interruFt 
Dop 

1a al ,ret_from_irdq 

jz al 

noPp 


END(it8172_IRQ) 


其 中 NESTED(it8172_IRQ,PT_SIZE,sp) 是 一 条 宏 定义 , 宏 的 第 一 个 参数 是 函数 名 ,后 
两 个 参数 指示 出 在 中 断 进入 时 要 为 该 中 断 处 理 函 数 保留 一 定 地 址 空间 的 内 存 , 以 供 局 部 变量 
使 用 。 

接 下 来 的 宏 SAVE_ALL 就 是 保存 所 有 CPU 的 通用 寄存 器 ,CLI 清 除 中 断 允 许 。 然 后 从 
CAUSE 和 STATUS 寄存 器 里 获取 当前 产生 中 断 的 中 断 源 的 信息 ,并 进行 分 析 , 如 果 是 ,时 钟 
中 断 就 跳 到 时 钟 中 断 处 理 例 程 ,如 果 不 是 ,就 跳 转 到 it8172_hw0_irqdispatch( ) ,这 一 部 分 就 
是 需要 中 断 控 制 器 进行 判断 和 进一步 处 理 的 ,后 面 将 对 此 进一步 讲解 。 

与 进入 中 断 的 处 理 相 对 的 是 ,从 中 斯 返回 的 处 理 , 在 每 一 个 中 断 处 理 的 末尾 都 有 一 句 
JMP ret_from_irq。 这 一 部 分 程序 ,在 “Entry. S 中 定义 ,可 以 想像 , 它 需 要 恢复 所 有 的 通用 
寄存 器 ,需要 恢复 中 断 请 求 允 许 ( 在 STATUS 中 ) ,需要 恢复 CPU 先前 的 工作 模式 状态 (Ker- 
nel 态 ,还 是 用 户 态 ) ,需要 恢复 栈 寄 存 器 (SP) ,最 后 从 中 断 返 回 跳 转 (IRET) 。 

代码 片段 如 下 所 示 :、 

A/ 尖 关 关 关 关 关 六 尖 凑 凑 凑 关 关 次 关 其 尖 其 关 关 其 凑 其 基 关头 关 尖 关 关 关 关 类 关 关 尖 关 其 新 尖 尖 闪闪 其 尖 关 关 关 关 次 凑 源 产 产 关 次 关 新 关 

x< Entry.S 

尖 关 关 尖 关 关 类 次 关 次 关 类 类 并 关 关 闫 尖 产 关 关 关 关 源源 关 洒 关 关 其 关 关 关 关 关 关 关 其 凑 关 关 关 关 关 关 其 关 关 关 关 关 关 其 关 关 关 关 关 人 
EXPORIT(Cret_from_irq) 

EXPORT(ret_from_exception) 


演 F 
rw 


估 


鹤 深 区 > 


et 
EAI 
2 


经 六 


六 
簿 
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媒 lw t0,PT_STRATUS(sp) 。” 井 返回 到 内 核 模式 ? 
人 andi t0 ,t0 ,KU_USER 
起 bnez t0 ,ret_from_sys_cal1 
次 ] restore_al1 
件 reschedule: jal Schedule 
设 
也 - EXPORTCret_from_sys_cal1) 
了 .type ”ret_from_irq,@function 
剧 # 是 否 需 要 重 调度 或 信号 原子 测试 
想 mfc0 t0,CP0_STRTUS 
与 OFi 七 0 ,七 0 ,1 
方 


XOI 工 七 0., 七 0 , 工 
mtc0 t0 ,CP0_STRATUS 


nop;y nopy nop 


1Lw Vv0 ,TARSK_NEED_RESCHED($428) 
1W V1,TRSK_SIGPENDING($28) 
bnez Vv0 ,reschedule 


bnez Vv1,Signal_return 
FEXPORT(restore_al1) 


TesStore_al1; ,. Set Doat 
RESTORE_RALL_AND_RET 
.Set at 


与 9.2. 3 小 节 所 介绍 的 异常 向 量 矢 量 安装 类 似 , 也 需要 对 中 断 矢 量 进 行 安装 ,本 例 中 ， 
IT8172G 中 断 控 制 器 的 输出 端 连接 到 CPU 的 中 断 输入 线 0, 所 以 在 init_IRQ( ) 数 中 ,有 如 
下 初始 化 语句 : 

set_except_vector(0，it8172_IRQ)5 


与 9. 2. 3 小 节 类 似 ,set_except_vector( ) 的 第 一 个 参数 是 矢量 号 。 


/ 关 兴 关 基 关头 兴 关 关 尖 关头 关 尖 关 关 其 关 关 关 兴 关 关 兴 关 关 其 关 尖 关 关 关 尖 尖 关 其 并 兴 关 关 兴 关 关 尖 凑 尖 关 其 关 关 兴 关 关 尖 关 关 关 关 其 
闪  Irq.C 

关 兴 尖 尖 关 尖 尖 凑 尖 尖 凑 关 关 关 关 闪 关头 闪闪 尖 状 关 关 关 关 关头 关 关 关 其 尖 尖 关 关 关 关头 关 关 关头 兴 关 头 尖 关头 并 关头 关 尖 其 关 关头 人 
井 include <1inux/errno. hb 之 

井 include <<1Linux/ in 让 .h> 

井 include ……- 

提 include ……- 


井 undef DEBUG_IRQ 
# ifdef DEBUG_IRQ 
井 define DPRINTK(fmt,args...) printk("%s:; "fat， FUNCTION _ , 井 井 args) 
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井 else 

提 define DPRINTK(Cfmt,args...) 

井 endif 

井 ifdef CONEIG_REMOTE_DEBUG 

extern void breakpoint(void); 

井 endif 

井 define EXT_IROO_ TO _ IP27/x* IP2#*/ 
井 define EXT_IRQ5 TO_IP7V/x* IPT7 */ 


unsigned int local_bh_count[NR_CPUS]; 
unsigned int Iocal_irq_count[NR_CPUS]; 

void disable_it8172_irq(Cunsigned int irq_nr7; 
void enable_it8172_irq(unsigned int irq_nr); 


注 : 硬 件 中 断 控制 器 的 寄存 器 地 址 。 


Struct :it8172_intc_regs volatile x 让 8172_hw0_icregSs 
= (Struct it8172_intc_regs volatile x ) 
(KSEG1ADDR(IT8172_BPCI_IO_BRASE + IT_INTC_BRASE) )， 


注 :CPU 状态 寄存 器 中 断 位 的 屏 项 与 设置 。 它 们 是 在 CPU 级 对 硬件 中 断 的 允许 与 禁止 。 
对 于 CPU 一 级 的 中 断 控 制 将 影响 到 所 有 的 硬件 中 断 , 包 括 通 过 硬件 中 断 器 扩展 的 外 部 中 断 
以 及 没有 通过 中 断 器 扩展 的 直接 连接 到 CPU 其 他 中 断 输入 线 的 所 有 硬件 中 断 。 


/x 这 个 函数 用 于 小 心 存 取 CEP0 中 断 屏蔽 位 x / 
static inline void modify_cp0_intmask(unsigned clLr_masky,unsigned set_mask) 
《 
unsigned long status = read_ 32bit_cp0_register(CP0_STRTUS); 
Status &= ~((clr_mask & 0xFF) << 8) 
Status | = (set_mask & 0xFF) << 8; 
write_32bit_cp0_register(CP0_STRTUS ,status) ; 
} 
static inline void mask_irq(unsigned int irq_nr) 
《 
modify_cp0_intmask(Cirq_nry 0)3; 
} 
static inline void unmask_jirqCunsigned int irq_nr) 
《 
modify_cp0_intmask(0,irq_nr); 


了 81 
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调 注 : 在 中 断 控制 器 这 个 级 别 对 中 断 的 允许 与 禁止 。 
公 void local_disable_irq(Cunsigned int irq_nT) 
工 N 

软 

件 unsigned 1ong flagsy 

国 

设 SavVve_and_cli(flags); 

光 disable_it8172_irq(irq_nr); 

人 restore_flags(ftlags)y 

ov 

相 } 

Vi 

二 void local_enablje_irq(unsigned :int izrq_nr) 
当 所 

1 unsigned long flags; 


save_and_c]li(flags); 
192 enable_it8172_irq(irq_nr); 
restore_flags(fl1ags); 
》 
voljd disabJle_jit8172_irqCunsigned int irq_nr) 
{ 
DPRINTK("disable_it8172_irq % dN\n" ,irq_nr); 
iE((irq_nr = IT8172_LPC_IRQ_BRSE) 8&& (irq_nr < = IT8172_SERIRQ_ 15)) 
. 
/x IPC 中 断 * / 
让 8172_hw0_icregs - 盖 1pc_mask | = 
(1 << (irq_nr -~- IT8172_LPC_IRQO_BRSRE) ); 
} 
else if ((irq_nr > = IT8172_LB_IRO_BRASE) && 
(Cirq_nr < = IT8172_IOCHK_IRQ) ) 
{《 
/* 局 部 总 线 中 断 * / 
it 让 8172_hw0_icregs - >>1b_mask | = 
(1 << (Cirq_nr - IT8172_LB_TRO_BRSE) ); 
} 
else if《〈(irdq_nr > = IT8172_PCI_DEV_IRQ_BRASE)S& 
(Cirq_nr < = IT8172_DMR_IRO) ) 
{ 
/* BCI 或 其 他 中 断 * / 
让 8172_hw0_icregs - 之 pci_mask | = 
(1L<< (Cirq_nr - IT8172_PCI_DEV_IRQ_BRASE))? 
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else if ((irq_nr >>= IT8172_NMI_IRQ_BRSE) && 撕 

(irq_nr < = IT8172_PONWER_NMI_IRQ) ) 扩 

{ 起 

-LARy 

/yx MT 中 断 x/ 软 

it8172_hw0_icregs - >>nmi_mask | = 小 

(1 < 一 (irq_nr - IT8172_NMI_IRO_BRSE)) ; 到 

计 

) 

太 

else { 地 

panic("disable_it8172_irq: bad irq % d",irq_nr); 三 

) 嫩 

} 人 

， ， Se 计 
void enable_it8172_irq(unsigned int irq_nr) 

{ 
了 了 93 


DPRINTK("enable_it8172_jirq $ dirq_nr); 
ifE《〈《(irq_nr 盖 = IT8172_LPC_IRQO_BRARSE) S&& 
(irq_nr < = IT8172_SERIRQ_15)) 
人 
/* LPC 中 断 * 7/ 
it8172_hw0_icregs - 1]pc_mask & = 
~(1 << (irq_nr - IT8172_LPC_IRQ_BRSE)); 
} 
else if((irq_nr 盖 = IT8172_LB_IRQ_BRASE) && 
(irq_nr < = IT8172_IOCHK_IRQ) ) 


/* 局 部 总 线 中 断 * / 
t8172_hw0_jicregs - >]b_mask & = 
~ 人 (1 << (irq_nr - IT8172_LB_IRQO_BRASE) ); 
} 
else iE ((irq_nr > = IT8172_PCI_DEV_IRQ_BRSE) && 
(irq_nr < = IT8172_DMR_IRQ) ) 
{ 
/x PCI 或 其 他 中 断 * / 
让 8172_hw0_icregs - 盖 pci_mask & = 
~(1 << (irq_nr - IT8172_PCI_DEV_IRQ_BRASE) ); 
} 
else 让 ((irq_nr 盖 = IT8172_NMI_IRQ_BASE) && 
(irq_nr < = IT8172_PONER_NMI_IRQ) ) 
{ 
/xx NMI 中 断 */ 
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垦 让 8172_hw0_icregs - 盖 nmi_mask &= 

入 ~(1 << (irq_nr - IT8172_NMI_IRO_BRSE) ) ; 
让 } 

软 else { 

攻 和 5 

件 panic("enable_it8172_irq:， bad irq % dirq_nr); 
该 

Y } 

计 

人 

二 Static unsigned int startuP_ite_irq(unsigned int irqg) 

本 自 

人 

enable_it8172_irq(irq) ; 

水 Teturn 0 


} 


井 define shutdown_ite_irq disable_it8172_irdg 
井 define mask_and_ack_ite_irg disable_it8172_irq 


Statjic void end_ite_irqCunsigned int irq) 
《 
让 (1(irq_desc[ irq]. status & (IRQ_DISABLED|IRQO_INPROGRESS) )) 
enable_it8172_irq(irq); 
} 


static struct bw_interrupt_type it8172_irq_type = { 
"ITE8172"， 
Startup_jite_jirqy， 
Shutdown_ ite_irq， 
enable_it8172_irqy， 
disable_it8172_irq， 
mask_and_ack_ite_iraq， 
end_ite_iraq， 
NUDLL 
3 


statijic void enable_none(unsigned int irq) { }》 

Static unsigned :int startup_none(unsigned int irq) { return 0; }》 
static void disable_none(unsigned int irq) ({ 》 

Static void ack_npone(unsigned int irq) ( 》 

/x* 这 里 定义 :startup 等 价 于 "enable" ,shutdown 等 价 于 “disable”x* / 
井 define shutdown_none disable_none 


井 define end_none enable_none 


void enable_cpu_timer(void) 
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{ 欣 
六 
unsigned long flags; 入 
save_and_cli(Cflags); 
unmask_irq(1<<EXT_IRO5_TO_IP); / x timer interrupt * / 件 
restore_flags(flags); 设 
} 计 
-3 
注 : 中 断 向 量 的 初始 化 ,通过 set_except_vector 安装 所 需要 的 硬件 中 断 。 设 置 硬 件 中 断 年 
7 
控制 器 的 初始 工作 模式 与 状态 。 在 
多 
void _init init_IRQ (void) 广 
《 机 站 
int 1 
unsigned long flagsi; 
8 185 


menmsSset(irq_desc,0,sizeof(irq_desc)); 
Set_except_vector(0 ,it8172_IRQ) 


init_generic_irq(C); 

/x 屏蔽 所 有 中 断 * / 

it8172_hw0_icregs - 盖 ]b_mask = 0xffff; 
it8172_hw0_icregs - >]jpc_mask = 0xffff; 
it8172_hw0_icregs - 盖 pPci_mask 0xffffi; 
it8172_hw0_icregs - 盖 Dnmi_mask = 0xffff; 


/x 设置 所 有 中 源 为 电 平 触发 模式 * / 
让 8172_hw0_icregs - 盖 ]b_trigger = 0; 


it8172_hw0_icregs - 盖 ]pc_trigger = 0; 
it8172_hw0_icregs - 盖 pci_trigger = 0; 
it8172_hw0_icregs - nmi_trigger = 0; 


/* 触发 电 平 的 设置 * / 

/+#* URRT, 键 盘 , 鼠 标的 触发 电 平 为 高 电 平 * / 
it8172_hw0_icregs - 之 lpc_level = (0x1l0 | 0x2 | 0xl1000) 
it8172_hw0_icregs - 盖 1b_level | = 0x20; 


/* 触发 模式 为 边缘 触发 */ 
it8172_hw0_icregs -~ 1pc_trigger | = (0x2 | 0x1000); 


for (IE = 0 <= IT8172_LRST_IRQ; i++ ) 
irq_desc[Li].handler = &it8172_irq_types 
} 


- 提 ifdef CONFIG_REMOTE_DFEBUG 
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/* 如 果 本 地 串 行 IXO 使 用 调试 端口 ,等 待 内 核 EDB 连接 一 次 * / 
puts("Waiting for kgdb to connect...，"); 


set_debug_traps(); 
breakpoint(); 

井 endif 

} 


注 : 无 法 识别 的 中 断 的 处 理 , 可 能 会 进入 panic。 


void mips_spurious_interrupt(struct pt_regSs +# regSs) 


{ 


unsigned 1ong status causei; 


printk("got spurious interruptNn'"); 

status = Iread_32bit_cp0_register(CP0_STRATUS) ; 

cause = read_32bit_cp0_register(CP0_CAUSE)7 ; 

Printk(" status 多 X cause $%% XND" ,Status;cause)3 

Printk("epc 多 xx badvaddr 多 x N\n" ,regs - cCp0_epcyregs - 盖 cp0_badvaddr); 
// while(1);  // 由 于 无 法 正确 处 理 , 系 统 设计 者 可 以 在 这 里 将 系统 挂 起 。 
} 


注 :硬件 中 断 的 分 发 。 


void it8172_hw0_irqdispatch(Sstruct pt_regs # egS) 
{ 
Int irqj 
unsigned Short :intstatus = 0,status = 0; 
intstatus = it8172_hw0_icregs - Intstatus; 
if (intstatus & 0x8) { 
panic("Got NMI interrupt"); 
}》 
else if (intstatus & 0x4) { 
/x* PCI 中 断 */ 
irq = 0; 
status | = 让 8172_hw0_icregs - pci_reqj 
while (1 (status & 0xl)) { 
irQ++ ; 
Status 之 盖 = 1; 
}》 
irq += IIT8172_ECI_DEV_IRO_BRSE; 
//printk("pci int % dn"”,irq); 
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else 证 〈intstatus & 0Oxl) { 
/x* 局 部 总 线 中 断 * / 
irg = 0; 
status |= it8172_hw0_icregs - 盖 ]b_req; 
while (1!1(status & 0Oxl1)) { 
irq++ $ 
Status 之 之 = 15 
}》 
irq += IIT8172_LB_IRQ_BRSE; 
//printk("lb int % dn",irq)， 
》 
else if (intstatus & 0x2) { 
/* LPC 中 断 */ 
/* 由 于 一 些 LPC 中 断 为 边缘 触发 ,可 能 会 丢失 一 些 中 断 ， 
* 因为 在 同一 次 应 答 (acknowledge) 所 有 的 中 断 。 因 此 在 
* 这 里 修订 它 。 
将 沙 
status | = it8172_hw0_icregs - 1pc_req5 
it8172_hw0_jicregs - 盖 ]pc_reqd = 0; 
irq = 0; 
while(1(status & 0xl)) { 
irq 二 ++ 5 
Status 盖 亿 = 1; 
} 
irqd += IT8172_LPC_IRQ_BRSE; 
//printk(C"LPC int % dNn" yirq) ; 
} 
else ({ 
returny 
} 
do_IRQCirqyregs)? 


注 : 在 这 里 ,将 进一步 调用 系统 中 断 的 处 理 例 程 ,最 终 将 调 到 设备 驱动 里 所 安装 的 高 级 
( 别 ) 的 中 断 处 理 例 程 。 

} 

这 个 源 文件 中 给 出 了 与 中 断 控 制 器 打交道 的 大 量 处 理 例 程 ,包括 中 断 的 允许 与 屏蔽 的 逐 
级 设置 ， 人 了 设置 或 清除 的 操作 。 在 这 里 需要 重点 关注 最 
后 一 个 函数 


上 


志江 
这 


起 部 > 


sk 
-全 > 
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void 让 8172_hw0_irqdispatch(Cstruct pt_regs #+ regs); 


这 个 函数 就 是 在 前 面 low - ievel 级 处 理 (int - handier. S 文件 中 :NESTED(it8172_IRQ， 
PT_SIZE,sp) 函 数 ) 中 所 指向 的 中 断 控 制 级 的 处 理 。 在 这 里 对 于 INTO 中 断 作 进一步 的 判别 
和 派发 。 它 实质 上 就 是 获得 了 一 个 中 断 控 制 器 所 定义 的 物理 中 断 号 ,然后 由 大 家 熟知 的 do_ 
IRQ 进行 处 理 。do_IRQ 是 操作 系统 提供 的 一 个 中 断 处 理 和 派发 的 例 程 ,可 以 想象 ,在 那里 ， 
操作 系统 将 进行 物理 中 断 号 与 逻辑 中 断 号 的 映射 ,从 用 户 程序 (这 里 的 用 户 指 驱 动 ) 在 中 断 连 
接 时 所 注册 的 回调 函数 获得 设备 的 中 断 处 理 例 程 的 内 存 地 址 ,然后 转 到 设备 驱动 的 中 断 处 理 
函数 。 

小 结 : 

这 一 小 节 , 通 过 实际 例子 向 读者 讲述 了 中 断 这 一 核心 工作 在 系统 中 低级 别 (CPU 级 别 ) 的 
处 理 过 程 , 以 及 在 操作 系统 级 (BSP 级 ,中 断 控制 器 级 的 详细 处 理 过 程 , 并 讲述 了 BSP 级 的 处 
理 如 何 进 一 步 与 设备 驱动 级 之 间 的 交互 。 关 于 设备 驱动 级 的 处 理 请 参见 上 一 节 :“9. 1 中 断 处 
理 ” 的 讲述 。 


9.3 硬件 IO 的 访问 


在 设备 驱动 和 BSP 的 开发 中 ,需要 频繁 地 与 硬件 打交道 。 由 于 硬件 的 访问 与 内 存 的 访问 
存在 很 多 本 质 的 差别 ,所 以 访问 硬件 时 需要 注意 很 多 控制 方式 。 


9.3.1 避免 使 用 绝对 物理 地 址 


初学 者 在 开始 编写 与 硬件 打交道 的 程序 时 ,一 个 容易 犯 的 错误 就 是 使 用 绝对 物理 地 址 去 
访问 硬件 。 在 许多 现代 的 RISC 体系 里 都 使 用 了 MMU, 以 管理 虚拟 内 存 。 程 序 员 所 使 用 的 
是 虚拟 内 存 ,而 总 线 上 真实 访问 的 是 IO 空间 的 物理 地 址 或 同 内 存 RAM 的 实际 物理 地 址 。 
虚拟 内 存 与 物理 内 存 通过 MMU 作 映 射 。 

一 个 好 的 解决 办 法 是 使 用 宏 定 义 或 是 写 一 个 系统 通用 的 函数 来 访问 硬件 的 IO。 这 样 使 
得 修改 和 移植 都 很 方便 ,如 下 面 例子 所 示 。 

在 这 个 例子 中 ,给 出 了 在 MIPS 架构 下 虚拟 内 存 到 物理 内 存 之 间 的 转换 所 使 用 的 宏 。 
MIJPS 架构 下 K1 和 KO0 段 到 物理 内 存 之 间 使 用 SMMU 进行 直接 转换 ,所 以 比较 简单 ,其 他 
CPU 的 结构 相对 复杂 一 些 , 应 该 使 用 系统 提供 的 转换 接口 函数 进行 转换 。 

由 于 不 同 的 总 线 和 内 存 可 能 使 用 不 同 的 字 节 顺序 ,在 这 个 例子 中 ,还 接触 到 一 个 Endian 
的 例题 ,这 也 是 嵌入 式 底层 设计 中 常常 会 遇 到 的 一 个 问题 。 根 据 所 使 用 的 CPU 与 内 存 之 间 
是 否 使 用 了 一 致 的 字 节 顺序 ,可 以 修改 这 样 的 宏 以 适用 外 部 硬件 1O 的 访问 。 
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W 关 关 关 关 尖 凑 关 关 关 关 关头 关 关 次 尖 关 其 关 凑 尖 关 凑 基 关 关 关 凑 尖 关 关 关 汪 凑 尖 尖 关 关 其 关 关 尖 次 关 关 关 关 关 类 关 关 闪闪 关 关 关 关 关 基 凑 关 关 关 关 


> 


藉 Eile: pr]j_1l_inc.h 


尖 


Pie 


类 Copyright (c) 2008， 束 机 
兴 关 闪闪 闪闪 凑 兴 其 放 其 关 次 关 洪江 关 关 关 关 关 关 关 关 关头 关 关 关 关 尖 凑 关 关 并 兴 关 关 关 关 关 凑 关 关 并 关 关 关 凑 尖 兴 凑 济 话 尖 其 关头 关 凑 其 尖 关 凑 人 
DESCRIPTION， 让 

低 端 (Low - Level) 访 问 函 数 的 通用 定义 多 
Modification history 是 
Re 相 
2008/4/1 -ip 计 ial created 本 
兴 兴 尖 尖 关头 关头 其 关 凑 尖 关 关 关 类 关 关 尖 关 尖 关 基 关头 尖 凑 尖 关 其 关 其 关 关 关 关 关 关头 尖 关 洪涛 关 关 并 尖 闪闪 关 尖 尖 关 其 基 并 尖 关头 尖 关 关 关 关 / 咏 
# ifndef PRJ_LL INC_H 
井 define PRJ_LL_INC_H 

789 

1 共 
x x 基本 类 型 的 定义 
关 / 
井 define BYTE unsigned char 
井 define HWORD unsignedc short 
# define WORD unsigned :int 
# define PBYTE BYTE * 
井 define PHWORD HHWORD * 
# define PRWORD WORD * 
井 define ADDRS unsigned int 
井 define PRADDRS ADDRS # 
/ x# 一 一 一 一 一 一 一 一 ~~ 一 -一 一 一 -一 ~- 一 一 -一 一 ~- 一 -一 -一 一 -~ 一 一 一 一 一 ~ 一 一 一 一 -一 一 -一 一 一 一 一 -一 一 -一 一 一 一 
* # 地 址 转换 : 和 虚 地 址 < == 之 物理 地 址 
关 / 
井 define VERTTOPHYS(adr) ((adr)S&Ox1lfffffff) 


井 define PHYSTOKSEG0O(adr) ((adr) |0x80000000) 
井 define PHYSTOKSEG1(adr) ((adr) |0xaM0000000) 


共 兴 增加 这 段 定 义 以 处 理应 用 的 请 求 ,比如 说 :通过 内 存 卫 象 的 (mmapped) 

关 共 地 址 来 访问 

关 / 

井 iE defined(_ FFERNEL __) || defined(IN_SPMON) || defined(CIN_VLDP) 

井 if defined(_ KERNEL ) 

井 undef NOT_IN_SYSTEM /* 当 在 操作 系统 中 时 ,不 要 包含 诸如 "stdio.h" x* / 
- 井 endif 
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井 define TOVIRTRDRSCadr) PHYSTOKSEG1(adr) 

井 else 

/x* # 在 这 种 情况 下 ,用 户 应 该 确保 传 过 来 的 地 址 是 虚拟 地 址 * */ 
# define TOVIRTRDRSCadr) (adr) 

endif 

六 

x x define register table type 

关 / 

井 define REGRECORD 0 /* 记录 类 型 的 模式 * / 
define REGBITMRP 1 

提 define REGSVGTBL 2 
/x*-------------~-~------------ 

x x ITegister access ]ength 

闪 7 

# define REGLEN1 1 /xx BYTE 存 取 模 式 * / 
间 define REGLEN2 2 /xx HWORD 存 取 模 式 * / 
并 define REGLEN4 4 /xx WORD 存 取 模 式 */ 


/x* 是 否 需 要 字 节 旋转 ,以 处 理 低 字 节 顺序 ,或 高 字 节 顺 序 * / 
井 define _swap1(x) 《(x)&Oxffy》 
井 define _swap2(x) 《(((x) > 人 >8)&0Oxff)|(((xz)SOxff)<<8)) 
井 define _swap4(x)  N\ 
((((x)S&0xff)<<24)|(((x)S&Oxff00)<<<8)1(((x) 之 之 8)&0xff00)|(((x) 之 之 24)&Oxff)) 


#define _swadrb(a) 〈((a)&0xfffffffc) | (3-((a)&0x3))) 
# define _swadrh(a) 〔〈((a)&0xfffffffc) | (2-((a)&0x2))) 
井 define _swadrw(a) (〈a) 


x x 根据 所 定义 的 高 / 低 字 节 顺 序 ,定义 通用 的 读 写 宏 
x / 
厅 主 defined(LITTLE_ENDIRN) /xx 低 字 节 顺 序 x/ 


# define cftg_swap2(x) _Swap2(x) 
井 define cfg_swap4(x) _SWap4(x) 
井 define cfg_sab(a) (al) 
井 define cfg_sah(a) 《ay) 
井 define cfg_saw(ay) 《al) 


井 else /x* BIG_ENDIAMN- 高 字 节 顺序 * / 


井 define cfg_swap2(x) (x) 
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井 define cfg_swap4(x) 《xy) 撤 
#define cfg_sab(ay) _Sswadrb(a) 人 汪 
井 define cfg_sah(a) _Swadrh(a) 
井 define cfg_saw(ay) _Swadrw(a)》 件 
井 endif /xx LITTLE_ENDIRAN -~ 低 字 节 顺 序 * / 设 
ee 生生 克 下 本 下 区 和 
x x  C 函数 的 原型 申明 以 及 类 型 定义 年 
w/ 起 
井 ifdef LRNGURGE C | 与 
BYTE SYS_Tread_byte(RDDRS adr); 信 
HNORD SYSs_read_hword(aRADDRS adr) ; 1 
WORD SYS_read_word(ADDRS adr); 

Volid SYS_Nrite_byte(ADDRS adr ,BYTE val); 了 91 
Volid SYS_write_hword(RDDRS adr ,HNORD val); 

void SYS_wWTite_word(ADDRS adr,WORD val); 

/x 绝对 地 址 的 读 / 写 函 数 的 定义 * / 

BYTE SYS_read_byte_a(RADDRS adr); 

HWORD SYSs_read_hword_a(RDDRS adr); 

WORD Sys_read_word_a(ADDRS adr); 

Volid SYSs_write_byte_a(RDDRS adr,BYTE val); 

Void SYS_wTite_hword_a(RDDRS adr ,HNORD val); 

Void SYS_Write_word_a(RADDRS adr,WORD val); 

void SYS_set_led(BYTE val); 

volid rmbflushCvoid) ; 

/* 定义 系统 读 写 寄存 器 的 宏 , 使 用 物理 地 址 * / 

井 define SYS_RERAD_BYTE(a) SYS_read_byte (TOVIRTRDRS(Ca) ) 

间 define SYS_RERAD_HWORD(a) SYS_read_hword(TOVIRTRDRS(Ca) ) 

间 define SYS_RERAD_WORD(a) SYS_read_word (TOVIRTRDRS(a) ) 

间 define SYS_NRITE_BYTE(ayv) SYS_write_byte (TOVIRTRARDRS(Ca) ,v) 

林 define SYS_WRITE_HNWORD(ayv) SYS_write_hword(TOVIRTRDRS(Ca) ,V) 

井 define SYS_WRITE_NORD(ayv) SYS_Write_word (TOVIRTRDRS(a) ,v) 


提 endif /yx LARNGURGE Cx / 

井 endif / x*x PRJ_LI INC_Hx / 

在 相应 的 源 文件 中 可 以 调用 这 些 宏 定义 来 实现 具体 的 读 写 操作 。 

值得 注意 的 是 ,编译 器 的 优化 算法 常常 会 改变 源 程序 中 的 执行 顺序 。 比 如 说 有 以 下 两 条 
Ci 语言 的 语句 : 
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关 〔《intx )0xli0004422 = 0xl12345678; 
x*《int x )0x10004488 = 0xffff0000; 


编译 器 可 能 把 它 编译 成 : 

x (int x )0x10004488 = 0xffff0000; 

x (intx )0x10004422 = 0x12345678; 
甚至 于 在 它们 中 间 插 和 人 别 的 代码 ,这 在 对 硬件 IO 操作 的 时 间 往 往 是 不 期 望 的 ,那么 可 以 采 
用 关键 字 “volatile” 来 实现 这 一 目标 ,如 下 如 示 : 


井 define TST_RDBYTE (adr) (#x (volatile BYTEx* )(adr)) 

井 define TST_RDHWORD (adr) (xx(〈(Vvolatile HNWORD x* )(adr)) 

井 define TST_RDWORD (adr) (x (volatile WORD x* )(adr)) 

井 define TST_WTBYTE (adr,v) x(《Volatile BYTE * )(adr) = 
井 define TST_WTHWORD (adr,v) 类 《Volatile HWORD * )(adr) = Yv 
井 define TST_WTWORD (adr,v) x《Volatile WORD x* )(adr) = YT 


9.3.2 ”内存 一 致 性 问题 


内 存 一 致 性 的 问题 是 与 cache 相关 的 。 在 存储 器 总 线 上 ,往往 有 多 个 总 线 主 设备 。 例 如 
一 个 外 设 硬件 ,将 一 个 数据 或 一 批 数据 直接 或 通过 DMA 间接 写 人 到 系统 内 存 (RAM) 中 ,这 
时 ,CPU 可 能 没有 得 到 通知 ,或 者 是 CPU 直接 从 cache 里 取得 了 过 时 的 数据 。 这 对 于 循环 
Buffer 的 情况 问题 更 突出 。 与 之 相对 的 ,CPU 在 写 数据 到 内 存 时 ,为 了 提高 写 的 效率 , 以 及 为 
了 尽量 少 访问 外 部 总 线 ,常常 采用 Write Buffer 的 机 制 , 但 写 入 一 个 数据 时 ,不 是 立即 将 这 个 
数据 写 人 到 外 部 存储 器 中 ,而 是 写 到 CPU 内 部 的 一 个 写 缓 冲 里 ,等 到 写 缓 冲 满 ,或 者 程序 强 
制 要 求 CPU Flush 这 个 写 缓冲 的 时 候 ,CPU 才 请 求 外 部 总 线 执 行 一 次 批 处 理 的 写 操作 。 那 
么 在 这 个 过 程 中 ,如 果 有 一 个 外 部 的 硬件 主 设备 需要 访问 这 块 内 存 , 读 取 的 数据 就 可 能 是 过 时 
的 .没有 更 新 的 数据 。 

在 上 面 这 两 种 情况 下 ,都 出 现 CPU 和 一 个 外 部 硬件 设备 对 于 同一 个 物理 内 存 地 址 ,在 同 
一 时 刻 “ 看 到 ?的 数据 却 不 相同 的 错误 。 这 种 现象 就 是 内 存 不 一 致 的 问题 。 

内 存 不 一 致 的 另 一 种 现象 是 发 生 在 ICache 与 DCache 之 间 。 由 于 CPU 常常 采用 了 分 离 
的 cache 来 适用 于 指令 和 数据 的 读 取 。 在 系统 加 载 程 序 或 中 断 安装 程序 把 一 段 程 序 ( 代 码 在 
内 部 表示 为 二 进 制 的 数据 ) 复 制 到 一 个 特定 的 区 域 的 时 候 ,CPU 看 到 的 却 是 以 前 读 取 的 指令 。 
如 果 碰 巧 曾 经 执行 过 这 段 地 址 的 代码 ,CPU 将 其 读 入 到 过 ICache, 并 且 没 有 被 别 的 指令 代码 
所 冲 掉 ,就 会 发 生 上 述 的 情况 。 

内 存 (cache) 的 不 一 致 给 程序 的 设计 和 系统 的 运行 带 来 了 危害 。 程 序 员 在 系统 程序 的 设 
计 中 必须 充分 考虑 这 些 因素 , 当 使 用 DMA 或 是 一 个 硬件 读 写 数 据 到 内 存 的 时 候 , 要 对 CPU 
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对 应 地 址 段 的 cache 作 刷 新 ,或 者 是 使 用 uncache 的 直接 内 存 访 问 。 就 如 同 物理 学 上 “惯性 ” 氢 
对 于 日 常生 活 肌 也 有 利 一 样 , 也 可 以 应 用 cache 不 一 致 的 现象 来 做 一 些 事情 。 入 
下 面 的 这 个 代码 片段 就 是 利用 cache 不 一 致 的 现象 来 测试 Icache 是 否 工作 ,并 测试 们 
ICache 的 大 小 。 系 统 里 没有 一 条 指令 或 是 一 个 状态 寄存 器 来 指示 CPU 中 cache 的 大 小 ,但 可 “| 件 
以 通过 下 面 或 类 似 的 方法 计算 出 来 。 设 
分 析 这 个 例子 有 助 于 掌握 cache 的 内 部 工作 机 制 ,从 而 也 有 助 于 提高 开发 者 的 系统 程序 计 
设计 能 力 。 下 面 仍然 是 针对 MIPS CPU 的 例子 ,如 果 CPU 是 ARM, 其 实现 与 之 类 似 ,只 不 过 “| 十 
所 使 用 的 指令 不 同和 代码 形式 不 同 。 外 
/* -MGN- 这 个 文件 测试 Cache 的 尺寸 ,存储 在 寄存 器 vl 中 方 
如 果 失 败 ,将 v0 置 为 0xffffffff. 法 

交 闪闪 尖 / 
井 include “regs.h”" 了 了 93 了 


井 include "cpu_comnon.h" 


. Set noat 


. Set noreorder 


# 井 define start _start 


,七 ext 
.9lobl start 
.ent Start 
Start: 
PROLOGUE_MGN # 测试 程序 的 初始 人 口 
/x 一 MGN- add this section to test 立 files 1 提 xx / 
] sp,0Oxa00a0000 井 设置 临时 栈 指针 0xa00a0000 
bal ”CacheClear 井 清理 所 有 的 Dcache 和 Icache 
Dop 
bal 1 井 跳 转 到 前 面 的 标号 1, 使 ra = 标号 1 的 地 址 
nop 


Jui S0 ,0x81ff 井 sS0 = 0x81ff0000 

and ” S0,s0,ra 井 s80 = s0 &ra 

1 s5 ,0x400 # 设置 初始 icache 的 大 小 为 s5 = 0x400 
test_]JPp， # 这 是 测试 主 循环 


bal testichesize 
move “ a0,s5 


beqz “ v0 ,pass # 如 果 v0 =0, 则 pass 
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髓 move  V1,S5 
和 人 lui t+t0,4 
式 slt 。 v0,s5,t0 井 如 果 v01= 0, 且 size = s5 盖 0x40000, 不 再 测试 ,failed 
软 beqz  v0,fail 
件 nop 
议 b test_1p 井 size = s5 小 于 0x40000 , 增 大 size 继续 测试 
网 sS11 8s5,Ss5，,1 井 s5 = S$5<<<<1 
辕 井 间 间 井 井 间 间 井 间 井 井 井 间 井 井 井 井 井 end of test 间 井 井 并 间 井 井 间 并 井 井 间 井 井 井 间 井 井 间 并 井 井 并 间 提 
想 .glob1l pass 
己 pass， 
其 b common 
ori v0,$0,0xabcd 

井 stal1l， 
194 左 ori v0, $0,0xaaaa 

,glLobl fail 

fail， 
ori v0，$0,0xdead 
Common ; 

nop 

EPEPILOGUR_MGN 

, end Start 


.ent testichesize 
testichesize: 

/* 将 测试 代码 存放 在 0x00100000 处 */ 
addiu SPp, SP， -64 

SW ray56(sSp) 

SW s1,8(sp) 

SW S2,12(sp) 

SW sS3,16(sp) 


move “ S1,a0 井 si = a0 = 0x400 

lui 。 a0,0x0010 /x 在 当前 pc 值 高 于 1M 的 地 方 测试 ,a0 = 0x00100000 x / 
add ，a0,a0,s0 

move “sS2,a0 井 s2 = a0 = s0+0x100000 

1a al icache_dat 井 将 icache_dat 的 4 个 word 的 代码 复制 到 0x00100000 
bal ”cphandje 提 目标 :s0 + 0x100000 , 源 : icache_dat 

1 a2，4 间 复制 的 长 度 是 4- longs 


/ x Some offset by size_sl,s3 = SO0+0x100400 * / 
add ”a0,s2,s1 井 将 icache _ dat 的 4 个 word 的 代码 复制 到 0x00100400 


move “S3，a0 


1a al, icache_dat 
bal cphandle 
1i a2，4 


/* clear both i/dcachex / 
bal ”CacheClear 


nop 


jalr  s2 

move “vv0 ,zero 

// 

/xxYV0 should be lx/ 
beqz  v0，,1f 

1IL V0, 一 1】 


lui  a0,0xa000 / * uncache 让 x/ 


OF a0，,a0，S2 

】a al, icache_dat0 
bal ”cphandjle 

1] a2，4 

jalr  s3 

fove “ Vv0，,zero 

// 

/x#VO shouldbe1x/ 
beqz  v0，,1f 

II Vv0， 一 工 
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间 目标 :s0 + 0x100000 , 源 : icache_dat 
提 复制 的 长 度 是 4- longs 


井 清 Dcache 和 Icache 


# 跳 转 到 s2 = s0 + 0x100000 ,执行 那里 的 代码 
井 + 0x100000 处 的 代码 被 装载 到 ICache 中 
提 “add v0y,v0,1; nop; jzrai nop?” 


# 将 新 的 代码 复制 到 s2 
井 “add v0o,v0,0; nop; j raji nop” 


# 执行 s3 
井 “add  v0,v0,1; nopfy j ra;y nop?” 


/x* 如 果 s2/s3 是 在 同一 个 icache 标签 , 则 必定 重新 装载 代码 到 icache 中 */ 


jalr  S2 

OL V0,， Zeroy1 
// 

/x*V0 应 该 是 0*/ 
bnez vv0 ,ff 

1I Vv0, 一 工 


move “ v0 ,zero 


1w ra 56(Sp) 
]w s1,8(sp) 

]w s2,12(sp) 
J1w s3,16(sp) 


| 工 


## 执行 s2 
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插 addiu sp,sSp,64 
.end testichesize 
式 icache_dat0 ， 
中 . Word 0x34020000 ,0x00000000 ,0x03e00008 ,0x00000000 
设 # 这 是 数据 表示 的 代码 , 它 等 价 于 
计 井 “add  v0,v0,0; nopi jj ra; nop?” 
2 icache_dat， 
让 . Word 0x34020001 ,0x00000000,0x03e00008,0x00000000 
想 # 这 是 数据 表示 的 代码 , 它 等 价 于 
3 间 “add v0,v0,1; nop;i j rai nop?” 
廊 
法 .七 ext 
.aligmn 4 
196 .ent CacheCjJear 
CacheClear 
. Set Poreorder 
mfc0 t3 ,CO0_SR /xx 保存 SR */ 
DoPp 
mtc0 zeroyC0_SR /x 禁止 中 断 */ 
/x invalidate data cache x / 
mtcO zeroyC0_CCTT /x 清 0 缓 存 (cache) 控 制 寄 存 器 * / 
nop 
1 +t1 ,CCTL_DIV1 
mtcO t1,C0_CCTL /* 使 数据 缓存 (cache) 无 效 * / 
nop 
mtc0 zeroyC0_CCTL /* 清 0 缓 存 (cache) 控 制 寄存 器 * / 
nop 
/* 等 待 几 个 时 钟 周期 * / 
1 tl1 ,10 
1:， Subu 七 1 , 工 
bnez t1L1 ,Tb 
nop 
/* 使 指令 缓存 无 效 *x / 
invalidateICache ， 
mtc0 zeroy,C0_CCTTL /x* 清 0 缓 存 (cache) 控 制 寄存 器 * / 
nop 
] tL ,CCTL_IIv1 
mtc0 t1,C0_CCTL 。/x* 使 指令 缓存 (cache) 无 效 * / 


nop 
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二 


mtc0 zeroyC0_CCTL /x* 清 0 缓 存 (cache) 控 制 寄 存 器 * / 区 
Dop 入 
/x* 等 待 几 个 时 钟 周期 * / 趟 
1i tl1,10 轶 
件 
1: subu 七 L， 工 3 
bnez tl1 ,1b 议 
计 
nop 3 
ce 
mtc0 t3,C0_SR /x#x 返回 到 先前 的 状态 * / 霹 
] Ia 并 
与 
nop -了 
.end CacheClear 人 
1 
/x 原 型 :cphandle(int x dst,intx srcyint nlongs)x / 
. ent cphand] 
ent cp e 5 
cphand]le: 
beqz a2，1f 
Jlw v0,0(Cal) 
addiu al,al,4 
SW v0,0(a0) 
addiu a0,a0,4 
b cphandle 
addiu a2,a2, 一 1 
1: 
]Jj ra 
nop 
.end cphand]le 
说 明 : 
本 程序 通过 使 用 了 两 段 不 同 的 代码 来 对 内 存 不 同位 置 进行 测试 ,如 下 所 示 : 
icache_dat0 ， 


.Word 0x34020000 ,0x00000000 ,0x03e00008 ,0x00000000 


# 这 是 数据 表示 的 代码 , 它 等 价 于 
间 “add  v0,v0,0i nop; jjraiy nop?” 
icache_dat ， 
. WOrd 0x34020001,0x00000000 ,0x03e00008 ,0x00000000 
# 这 是 数据 表示 的 代码 , 它 等 价 于 


莫 “add  v0,v0,1; nop; jjraiy nop?” 
导致 ICache 的 Miss, 从 而 来 计算 出 Icahce 的 大 小 。 程 序 中 使 用 了 Cache 的 一 个 连接 特 
性 , 即 如 果 两 个 内 存单 元 所 对 应 于 同一 个 Cache-line, 即 同一 个 标签 (tag) 时 , 则 需要 把 老 的 指 


下 


3 
下 


NE 
Sa 


二 


h 
AD 
Oo 
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令 换 出 ,将 新 的 指令 装 人 , 即 Cache Miss。 程 序 在 第 一 次 执行 寄存 器 S2 处 所 指示 的 代码 时 ， 
这 段 指 令 内 存 是 被 装 入 到 Cache 中 了 , 接 下 来 执行 与 S3 处 偏 移 0x400,0x800,0x1000 处 指令 
的 时 候 ,S3 处 的 指令 代码 也 将 被 装 人 到 Cache 中 不 同 的 位 置 , 但 当 S3 增 大 到 一 定 程度 时 ,S2 
与 S3 恰好 位 于 同一 个 Tag, 这 发 生 在 ICache 大 小 的 整数 倍速 的 位 置 ,于 是 造成 S2 处 的 指令 
被 冲 掉 , 重 新 执行 S2 处 的 指令 时 将 从 内 存 中 装 人 指令 。 同 时 还 利用 了 一 个 特性 ,就 是 Cache 
的 大 小 是 2 的 寡 次 ,所 以 每 次 测试 的 时 候 ,s5=s5<<<<1 来 进行 测试 新 的 偏 移 位 置 。 

上 面 的 代码 给 出 了 一 个 对 CPU 内 部 特性 的 一 些 测试 , 需 要 对 程序 和 CPU 进行 精细 的 控 
制 , 设 计 一 些 针对 性 的 算法 。 


9.3.3 IO 访问 的 刷新 


在 硬件 体系 中 ,为 了 提供 系统 的 香 吐 力 , 减 小 外 部 存储 以 及 I/O 的 访问 ,在 总 线 接口 上 党 
常会 增加 一 些 读 写 缓冲 ,但 是 对 于 某 些 硬件 的 访问 ,访问 顺序 和 时 间 都 是 非常 重要 的 。 由 于 增 
加 了 缓冲 ,对 于 外 部 硬件 的 I/O 操作 可 能 不 会 立即 操作 到 硬件 上 ,而 是 等 到 延 后 的 某 个 时 刻 ， 
也 可 能 是 因为 总 线 的 竞争 , 才 会 真实 去 写 人 到 外 部 硬件 的 寄存 器 。 在 一 些 时 候 , 等 待 前 面 的 操 
作 结束 , 然 后 再 执行 后 续 的 硬件 操作 是 必需 的 ,这 种 情况 下 ,需要 对 硬件 的 I/O 操作 强制 去 刷 
新 ,使 对 I/O 写 操作 的 队列 全 部 执行 完毕 。 

不 同 的 CPU 体系 或 是 不 同 的 硬件 平台 ,有 不 同 的 VO 访问 刷新 的 操作 方式 。 例 如 MIPS 
下 对 于 一 个 非 Cache 区 域 的 O 地 址 空间 的 读 操作 ,或 是 ARM 体系 下 的 RMB 操作 ,可 以 刷 
新 I/O 写 队列 。 

打 断 指令 流水 线 也 可 以 清除 当前 的 MO 写 操作 。 具 体 的 实现 需要 针对 特定 的 硬件 平台 
的 设计 处 理 方式 而 作 不 同 的 处 理 。 
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Linux 的 启动 过 程 


本 章 从 Linux 的 启动 过 程 的 实际 分 析 来 考察 板 级 支持 包 中 所 要 实现 的 设计 任务 。 


10.1 Linux 的 启动 流程 


图 10-1 显 示 了 Linux 启动 的 流程 框图 。 

系统 上 电 时 ,最 初 运行 ROM 中 的 Boot - loader, 它 将 操作 系统 内 核 映 像 加 载 到 内 存 。 然 
后 ,内 核 的 引导 部 分 作 各 种 初始 化 工作 ,分 配 和 配置 各 种 系统 资源 ,建立 各 种 软件 的 数据 结构 ， 
启动 内 部 的 基本 执行 功能 ,然后 加 载 设备 驱动 ,安装 文件 系统 ,最 后 运行 第 一 个 进程 , 即 初 始 化 
进程 。 在 初始 化 进程 中 ,进一步 启动 用 户 进程 ,启动 Sheli, 或 者 是 X- Windows。 之 后 ,用 户 
就 可 以 在 操作 系统 提供 的 Shell 或 是 图 形 Shell 上 执行 各 种 各 样 的 应 用 程序 。 

图 10-2 显示 了 Linux 启 动 时 的 执行 函数 细节 。 下 面 详细 分 析 Linux 的 启动 过 程 。 

Linux 的 boot 过 程 从 _stext 函数 开始 执行 ,这 个 函数 仅 次 于 Arch/host/kernel/head. S。 

文件 中 ,这 个 函数 在 一 些 版 权 中 也 叫 _start。 在 系统 最 初 的 启动 引导 过 程 中 ,中 断 初 禁 
止 ,Cache 也 被 设置 为 无 效 ,TLB 的 转换 也 被 设置 为 无 效 。 此 时 ,系统 里 只 有 最 小 的 资源 供 程 
序 使 用 。 所 以 在 BSP 的 早期 启动 运行 中 ,尽量 不 要 写 占 用 资源 多 的 例 程 。 

程序 控制 在 执行 跳 转 到 _stext 之 前 ,由 另 一 个 程序 Boot - loader 负责 整个 系统 的 初始 引 
导 。 从 技术 上 说 Boot - loader 不 属于 Kernel( 内 核 ) 的 一 部 分 。 在 许多 Kernel 实现 中 ,Boot - 
loader 是 一 个 独立 的 程序 包 ( 例 如 uboot), 它 的 作用 就 是 把 Linux 内 核 映 像 ( 常 指 的 映像 就 是 
一 个 内 核 程 序 或 数据 文件 系统 的 二 进 制 表示 形式 ) 从 存储 介质 (例如 :flash, 硬 盘 ,软盘 ,CD, 等 
等 ) 复 制 到 内 存 (RAM) 中 ,必要 的 时 候 , 在 复制 过 程 中 还 执行 解压 缩 ( 如 果 这 个 二 进 制 映像 是 
被 压缩 了 ) 。 然 后 程序 控制 跳 转 到 _stext。 一 有 旦 Boot - loader 把 操作 系统 加 载 到 内 核 , 并 引导 
执行 之 后 ,Boot - loader 的 使 命 就 完成 了 , 它 所 占用 的 系统 内 存 就 可 以 被 释放 以 供 操作 系统 统 
一 调度 分 配 使 用 。 

通常 _stext 是 在 位 于 Kernel 映像 偏 移 0x1000 字 节 的 位 置 。Kernel 映像 常常 被 连接 到 
0x8000000 的 虚拟 内 存 位 置 ,并 在 起 始 位 置 定 义 了 符号 _text, 因 此 _stext 的 起 始 地 址 按 _text 十 
0x1000 计算 。 具 体 实 现 中 ,是 与 连接 脚本 以 及 代码 中 定义 这 些 位 置 相关 联 。 如 下 代码 所 示 。 
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鬼 

入 提取 以 及 解压 内 核 映 像 ( 包 
括 Ramdisk， 如 果 使 用 的 话 ) 
软 

件 

] 奈 引导 启动 Kernel 

渤 

十 

四 初始 化 内 存 和 硬件 

机 “ 训 

广 

这 初始 化 设备 驱动 

人 安装 文件 系统 


运行 初始 进程 sbin/init 


图 10-1 Linux 启动 流程 框图 
在 连接 脚本 文件 中 ,定义 Kernel 二 进 制 映像 的 内 存 布局 : 


/* 连接 配置 脚本 * / 
SECTIONS 


{ 


，= 0x80000000 + CONEIG_MEMORY_STRRT + 0x1000; 
_text = ,;/x* 代码 段 或 只 读数 据 段 * / 

} 

在 代码 文件 中 定义 kernel_start_addr 的 相对 偏 移 地 址 : 


/ x* _ bootloader code x / 


Startup 
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Start_kernel( ) 


startup_arch () 
bootmem init ( ) 
paging_init ( ) 

trap_init () 

Init_ IRQ () 

sched_ init ( ) 
init_timervecs () 

softirq_init ( ) 

time_init() 

console init ( ) 

init modules ( ) 

kmem_cache init ( ) 

calibrate_delay () 


Imem_init ( ) 


10-2 Linux 启动 执行 过 程 细节 
/x 跳 转 到 解压 缩 内 核 代 码 的 开始 位 置 */ 


mov. 1 kernel_start_addr ,r0 
]jnmp @r0 
nop 


kerne1l_start_addr ， 
.1ong _text + 0x1000 


10. 2 Linux 的 启动 过 程 简介 


10.2.1  _stext 溯 数 
下 面 代 码 显 示 一 个 _stext 函数 的 例子 ， 
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搬 ENTRY(_stext) 
六 1 Initialize Status Register 一 初始 化 CEU 状态 寄存 器 
下 mov.1 1f,r0 ! MD =1,RB= 0,BL = 0,IMRASK = OxF 
软 1dc r0，,sT 
件 
设 1 Initialize global interrupt mask -初始 化 全 局 中 断 屏 蔽 寄存 器 
3 十 mov 井 0,r0 
之 ldc r0,r6_bank 
起 ! 
起 mov. 1 2f,r0 
- mov r0,rl15 ! Set initial r15 (stack pointer) - 设置 stack 指针 
如 mov 井 0x20,rl ! 
人 shl18 rl 1! rl = 8192 
sub zl,z0 
202 ldc r0,r7_bank 1... and init_task 


! Initialize fpu- 初始 化 fpu， 
mov,. 工 7f,r0 
jsr @r0 


nopb 


1 Enable cache - 使 能 cache 
mov. 开 6f,r0 
jsr @r0 


，nop 


1 Clear BSS area 一 清 .BSS 段 
mov. 】 3 下, 工 1 
add 井 4,T1 
mov. 1 4f ,rz2 
mov 井 0,r0 

9: cmp/hs r2 ,Trl 
bf/s 9b ! while (zl < z2) 
mov. 上 rz0,@ -Ir2 


1 Start kernel - 开始 跳 转 到 kernel 
mov.1 5f,r0 


jnmp @zr0 

nop 
.balign 4 
1: .long 0x400000F0O 1 MD=1,RB=0,BL=0,FD= 0,IMRSK = 0xF 
2:， . long SYMBOL_NRME(stack) 
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:; ,. long SYMBOL_NRMRE(__bss_start) 
; .1ong SYMBOL_NRME(_end) 

,1ong SYMBOL_NRME(start_Kkerne]) 
.1ong SYMBOL_NRME(cache_in 计 ) 

. 1ong SYMBOL_，NRME(fpu_init) 


各 个 CPU 的 指令 不 一 样 , 这 里 不 介绍 特定 CPU 的 指令 。 对 于 各 个 CPU, 其 初始 部 分 的 
思路 都 是 一 样 的 。 

首先 初始 化 CPU 的 寄存 器 ,因为 大 多 数 CPU 的 状态 寄存 器 里 涉及 到 运行 模式 ,例如 : 
Kernel 态 或 是 用 户 态 以 及 中 断 允 许 位 等 。 

第 二 步 , 屏 项 所 有 的 中 断 源 。 因 为 这 时 系统 内 存 里 没有 初始 化 好 整个 系统 ,中 断 向 量 表 的 
位 置 里 并 没有 安装 好 正确 的 处 理 函 数 ,必要 的 中 断 处 理 设施 都 没有 进入 就 绪 状 态 。 

第 三 步 , 设 置 Stack 指针 ,有 了 Stack , 才 可 以 调用 子 函数 ,以 实现 正确 的 返回 ,或 是 使 用 私 
有 的 局 部 变量 。 

第 四 步 ,初始 化 fpu, 如 果 系 统 中 没有 使 用 ,也 要 考虑 将 这 部 分 功能 设置 为 禁止 状态 。 

第 五 步 , 使 能 Cache, 因 为 不 通过 Cache, 从 外 部 读 取 指令 和 数据 是 非常 缓慢 的 过 程 ,所 以 
程序 中 应 尽早 使 能 Cache。 

第 六 步 , 清 . BSS 段 。 

BSS 段 是 程序 中 未 初始 化 的 数据 段 ,默认 情况 下 ,未 初始 化 的 数据 段 的 初 值 被 认为 是 0， 
为 了 节省 程序 的 静态 存储 空间 ,对 于 初始 值 为 0 的 数据 段 ,连接 器 在 连接 的 时 候 把 它们 分 配 到 
BSS 段 。BSS 段 是 数据 段 的 一 种 ,它们 的 初 值 就 是 在 这 个 运行 时 刻 赋值 的 。 

最 后 ,在 这 个 代码 片段 的 后 面 定 义 了 一 系列 标号 。 标 号 的 数值 是 通过 宏 SYMBOL _- 
NAME(xxx_name) 来 定义 的 。 注 意 到 ,其 中 一 些 xxx_name 是 连接 器 在 连接 时 定义 的 ,在 程 
序 的 源 代 码 中 可 能 找 不 到 那 种 形似 函数 的 名 字 的 声明 及 实现 。 

另外 ,程序 中 有 6f,7f 这 样 的 引用 ,如 : 


mov.1 7f,r0 

它 表 示 向 前 面 找 ,最 近 的 名 字 为 6 的 标号 。 

类 似 的 有 :1b,2b,…，,6b, 其 含义 与 之 类 似 , 即 :向 后 找 ,最 近 的 名 字 为 1, 或 2,…,6 的 临时 
的 、 局 部 的 标号 。 


10. 2. 2 start_kernel 联 数 


start_kernel() 函数 位 于 kernel/init/main. c。 
start_kernel ( ) 像 一 个 曲目 目录 一 样 * 列 出 了 CPU 将 顺序 执行 的 所 有 初始 化 的 手续 。 如 
下 所 示 : 


mm 请 W 


汪 
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asmlinkage voljd __ init start_kernel(volid) 
{ 
Char x Command 1ine; 
unsigned long mempages; 
extern char saved_command_linef ]; 
Jock_kernel(); 
printk(1inux_banner) ; 
Setup_arch(&command_1line) ; 
Printk("Kernel command line; % sN\n" ,saved_command_ line)， 
parse_options(command_1ine) ; 
trap_init(); 
init_IRQ(C)# 


在 没有 调用 其 他 初始 化 例 程 之 前 ,Linux kernel 打印 出 一 条 熟识 的 启动 标语 ,然后 分 析 输 入 
的 命令 行 参数 。Linux 允许 用 户 向 Kernel 输入 参数 ,例如 ,启动 的 rootfs 的 位 置 。BSP 的 程序 设 
置 者 可 以 自行 设计 任意 的 命令 行 参数 ,然后 在 kernel 启动 的 时 候 由 Boot-loader 传 给 Kernel。 


10. 2.3 setup_arch 函数 


setup_arch 国 数 通 常 位 于 文件 : arch/<host>/kernel/setup. c。 

setup_arch 函数 的 功能 在 于 负责 最 初 的 .与 机 器 特定 硬件 相关 的 初始 化 过 程 , 包 括 初 设置 
主机 的 机 器 向 量 , 检 测 内 存 的 可 用 位 置 以 及 大 小 。Setup_arch 也 初始 化 一 个 最 基本 的 内 存 分 
配器 称 为 :bootmem, 以 在 系统 boot 的 过 程 中 使 用 。 

对 于 绝 大 多 数 的 CPU, 调 用 paging_init( ) 以 使 能 内 存 管理 单元 (MMU) 。 

主机 的 机 器 向 量 (machine vector) 是 一 个 包含 主机 名 字 以 及 一 系统 函数 的 指针 ,以 用 于 主 
机 特定 功能 单元 读 写 MO 端口 时 所 使 用 的 函数 。 从 而 允许 在 一 个 通用 的 内 核 平 台中 ,使 用 统 
一 的 API 接口 去 操作 与 机 器 特定 功能 相关 的 处 理 过 程 。 


10.2.4 trap_init 函数 


trap_init 图 数 通常 位 于 文件 : arch/<host>/kernel/traps. c。 

trap_init 函数 初始 化 与 处 理 器 的 中 断 相 关 的 一 些 功能 。 特 别 地 , 它 修改 处 理 器 的 中 断 向 
量 表 以 指向 真实 的 向 量 表 地 址 。 中 断 的 允许 要 等 到 系统 初始 化 的 后 期 ,在 calibrate_delay( ) 
孙 数 运行 前 进行 。 

以 下 是 一 个 trap_init ( ) 函数 的 例子 。 


void __init trap_init(void) 


{ 
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extern volid * Vbr_base; 
extern void x exception_handljing_table[ 14]; 
exception_handling_table[12] = (void x )do_reserved_inst; 
exception_handling_table[13] = (void * )do_illegal_slot_inst; 
as Volatile("1dc 多 0,vbr" 

: /xx no output x/ 

:; "rzr"(&vbr_base) 

， "memory") 


} 


10.2.5 init_IRQ 函数 


init_IRQ 函数 通常 位 于 文件 : arch/<<host 盖 /kernel/irq. c。 . 

init_IRQ 函数 初始 化 与 特定 硬件 相关 的 那 部 分 中 断 子 系统 。 中 断 控制 器 也 在 这 里 进行 
初始 化 ,但 是 相应 的 物理 中 断 线 是 禁止 的 ,直到 相应 的 设备 驱动 或 者 Kernel 模块 调用 request 
_irq( ) 时 ,特定 的 中 断 请 求 线 才 被 设置 为 允许 。 


10. 2.6 sched_init 函数 


sched_init 函数 通常 位 于 文件 : kernel/sched. c。 

sched_init 函数 初始 化 kernel 的 pidhash[ ] 表 , 它 是 一 个 Kernel 快速 通过 Process - ID 查 
找 进 程 描述 符 (process descriptor) 的 对 照 表 。shed_init 孜 数 然后 初始 化 各 种 ernel 内 部 时 
钟 所 使 用 的 底部 处 理 例 程 以 及 向 量 。 


10.2.7 do_initcalls 了 画 数 


do_initcalls 函数 通常 位 于 文件 : kernel/main. c。 

do_initcalls 函数 运行 一 个 函数 列表 ,它们 使 用 __initcall 属性 进行 注册 。 这 些 属 性 仅 适 用 
于 与 内 核 模 块 或 是 设备 驱动 一 起 编译 的 代码 ，_initcall 属性 消除 手动 维护 一 个 初始 化 设备 驱 
动 的 函数 表 。__initcall 机 制 通过 在 内 存 中 创建 一 个 常量 的 函数 指针 表 , 名 字 叫 做 “. initcall. 
init”, 它 们 指向 初始 化 函数 本 身 。 当 Kernel 被 连接 时 ,连接 器 把 所 有 的 初始 化 函数 的 指针 组 
织 成 单一 的 一 个 内 存 节 。 然 后 “do_initcalls( ) 依 次 调用 这 个 末 数 。 

__initcall 属性 的 安定 义 如 下 所 示 : 


typedef ;int (* initcal1l_t)(void)7， 

typedef void (* exitcal1_t+t)(void) ; 

井 define :initcall(fn) AN\ 

static initcall t+ initcall 间 井 fn _ _ init_call = fn 


厅 define init_call _attribute  (〈((unused，_section  〔〈". initcall, init"))) 
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do_initcalls( ) 函数 的 实现 如 下 : 


锯 

人 extern initcall tt initcal1_start，_initcall_end; 
软 static void _init do_initcalls(void) 
任 { 

讼 initcall tt x cal1l; 

计 - Call = &_ initcal]1_start; 

2 do { 

地 Cx call)(); 

二 Call1++， 

广 ) while (call 一 &_initcall_end) ; 
法 flush_scheduled tasks(); 


10.2.8 init 函数 


init 函数 通常 位 于 文件 : kernel/main. c。 

init 函数 完成 kernel 的 起 动工 作 。 它 通过 调用 do_basic_setup( ) 初 始 化 系统 的 PCI 以 及 
网 络 功能 。 进 程 调度 在 这 里 开始 被 允许 ,标准 的 输入 .输出 以 及 错误 流 被 创建 。Prepare_ 
namespace( ) 被 调用 以 安装 文件 系统 。 

有 了 文件 系统 后 ,init( ) 运 行 execve() 以 开始 发 起 初始 用 户 态 进程 /sbin/init, 如 果 它 已 存 
在 的 话 。 反 之 ,如 果 没 找到 或 是 不 存在 ,内 核 会 尝试 运行 “/bin/init”, 或 是 “bin/sh”。 如 果 都 
没 找到 的 话 ,Kernel 就 进入 panic 并 停止 运行 。 

init( ) 的 代码 显示 如 下 : 


Static int init(void x* unused) 
人 
Jock_kernel(); 
do_basic_setup(); 
Prepare_namespace(); 
free_initmem(); 


unlock_kernel() ; 


if (open("/dev/console" ,0_RDWR,0) < 0) 
printk("Warning，unable to open an initial console.N\n'"); 
《void) dup(0); 

(void) dup(0); 


让 〈execute_command) 
execVe(execute_command ,argv_init,envp_init)5 


execve("/ sbin/ init",argv_init,envp_in 让 ); 
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execve(" /bin/ init" ,argv_init,envp_jinit); 
execve(" /bin/sh" ,argv_init,envp_init); 


panic("No init found. Try passing init= option to kernelLl."); 


10.2.9 init 程序 


init 程序 是 所 有 用 户 进程 的 父 进程 。Init 的 工作 职责 在 于 通过 /etc/inittab 文件 的 指示 创 
建 其 它 的 用 户 进程 。 从 技术 上 讲 ,Kernel 的 启动 过 程 在 init 运行 之 前 已 经 全 部 初始 化 完成 。 
但 是 在 很 多 情况 下 ,init 还 是 被 认为 是 系统 启动 过 程 的 一 部 分 。 

/etcy/inittab 一 般 会 运行 诸如 mingetty 以 提供 一 个 登录 提示 ,以 及 运行 诸如 /etc/rc. d/ 
rc3.d 再 开始 更 多 的 用 户 进程 以 及 服务 ,如 :xinetd,NFS 以 及 crond。 一 般 地 ,一 个 典型 的 
Linux 工作 站 在 用 户 开 始 登录 之 前 已 经 有 几 十 个 不 同 的 进程 开始 运行 。 一 个 工作 站 可 以 通过 
修改 /etc/inittab 文件 的 内 容 来 更 改 启动 时 所 运行 的 程序 。 除 了 修改 inittab 来 更 改 启动 进程 
之 外 ,用 户 还 可 以 完全 更 换 其 它 的 init 程序 ,例如 ,一 个 嵌 人 式 设 备 的 主 程序 。 

下 面 显示 一 个 典型 的 inittab 文件 的 内 容 ， 


id:3:initdefault， 

# 系统 初始 化 。 

si;:Sysinit:/etc/rc, dy/rc.sysinit 

10:0:wait:/yetc/rc.dVrc 0 

11:1:wait:/etc/rc,.d/rc 1 

12:2:wait:/etc/rc.dy/rc 2 

13:3:wait:/etc/rc.d/rc 3 

14:4:wait:/etc/rc.d/rc 4 

15:5:wait:/etc/rc. d/rc 5 

16 :6:wait:/etc/rc.d/rc 6 

# 在 所 有 运行 级 别 下 都 运行 的 

ud: :once:/Sbin/update 

井 Trap CTRL - RLT - DELETE 

cal: :ctrlaltdel:/sbin/shutdowmn -t3 一 工 now 

# 在 标准 和 运行 级 别 下 运行 getty 

1:2345 :respawn:/sbin/mingetty tty1 
:2345 :respawn:/sbin/mingetty tty2 
:2345 :respawn:/sbin/mingetty tty3 


2 
3 
” 4:2345 :respawm: /sbin/mingetty tty4 
5:;2345 :respawmn:/sbin/mingetty ttYy5 
6 


:2345 :respawm: /sbin/mingetty tty6 
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小 结 : 

本 章 简单 介绍 了 Linux 的 启动 流程 ,在 Start_kernel() 函数 里 做 了 与 内 核 相 关 的 所 有 硬件 
的 初始 化 工作 ,其 中 包括 setup_arch()。 在 该 函数 中 ,将 对 BSP 中 特定 的 硬件 做 各 种 不 同 的 
初始 化 工作 。 

在 Linux 内 核 的 启动 的 过 程 中 ,内 核 可 以 像 应 用 程序 的 main() 函数 那样 接受 输入 参数 ， 
如 :setup_arch(& command_line) ;在 do_basic_setup() 中 将 处 理 这 些 输入 参数 ,从 而 实现 与 内 
核 的 交互 。 

在 do_initcalls 小 节 , 可 看 到 _init 的 宏 定义 ,从 而 知道 底层 函数 设计 中 ,前缀 _init 所 起 的 
作用 ,这 里 可 以 清楚 地 看 到 内 核 中 ,驱动 程序 的 加 载 过 程 。 

在 init() 郴 数 中 ,系统 做 完 各 种 初始 化 工作 之 后 ,开始 运行 第 一 个 用 户 程 序 "/sbin/init "。 
在 这 里 ,内 核 会 党 试 在 几 个 位 置 去 寻找 init 程序 。 如 果 找 到 ,就 调和 人 内存 ,开始 执行 它 , 如 果 没 
找到 任何 一 个 init 程序 , 则 系统 无 法 启动 第 一 个 用 户 进程 ,从 而 系统 启动 失败 ,进入 panic 死 
循环 。 

Init() 函数 与 init 程序 不 一 样 ,init 程序 是 一 个 驻 留 于 硬盘 上 的 一 个 应 用 程序 , 它 不 再 是 
系统 Kernel 的 一 部 分 ,而 init() 函 数 是 内 核 的 一 部 分 。Init 程序 再 次 查找 “/etc/inittab” 文 件 
中 所 描述 的 所 要 启动 的 所 有 用 户 程 序 , 这 包括 一 些 内 核 服 务 , 例 如 启动 网 络 服务 或 是 开启 一 个 
登录 终端 。 在 这 里 ,系统 设计 员 完 全 可 以 按照 自己 的 设计 意图 启动 任何 的 服务 和 应 用 程序 , 例 
如 :直接 启动 一 个 和 入 式 设备 的 主 界面 应 用 程序 。 
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WinCE 的 设计 


11.1 WinCE OS 平台 开发 简介 


Windows ”CE 是 微软 提供 与 支持 的 一 个 开放 式 、 可 裁剪 的 32 位 戏 人 式 操 作 系统 。 目 前 
通用 的 版 本 是 WinCE .NET 4.2,WinCE 5.0。WinCE 支持 大 家 熟知 的 窗口 技术 以 及 图 形 用 
户 界面 。 它 允许 系统 设计 者 建立 一 个 稳定 性 高 .实时 性 强 .外围 设备 支持 广泛 的 操作 系统 。 一 
个 典型 的 基于 WinCE 操作 系统 的 设备 被 设计 为 用 于 专门 用 途 的 独立 设备 ,通常 与 其 他 计算 
机 分 离 使 用 , 它 需 要 运行 一 个 小 型 化 的 操作 系统 ,对 于 中 断 有 确定 时 间 范 围 内 的 快速 响应 。 也 
可 以 用 于 一 些 企业 化 的 工具 中 ,例如 :工业 控制 方面 ,通信 用 集线器 ,收银 终端 器 ,以 及 消费 电 
子 产品 ,如 :照相 机 ,MP4 和 交互 电视 等 。 


11.1.1 WinCE 平台 的 开发 流程 


图 11-1 显 示 了 使 用 PB 开发 一 个 WinCE OS 平台 所 涉及 的 工作 流程 。WinCE 平台 的 
开发 需要 使 用 微软 提供 的 一 个 开发 工具 包 :Platform Builder〈 简 称 PB) 。PB 有 不 同 的 版 本 ， 
用 于 开发 不 同 版 本 的 WinCE 操作 系统 映像 Cimages)。PB 是 一 个 集成 开发 环境 ,其 中 集成 了 
开发 〈 设 计 , 编 译 ,测试 ,调试 ) 基 于 特定 处 理 器 系列 (如 :Intel IA32,ARM,MIPS,PowerPC， 
Xscale,…) 的 WinCE OS 贞 像 所 需要 的 全 部 应 用 工具 。PB 主要 用 于 OS 系统 平台 的 设计 , 它 
还 可 以 导出 一 个 特定 的 SDK ,以 用 于 在 这 个 OS 平台 上 开发 各 种 应 用 程序 。 所 以 基于 通用 CE 

台 开 发 应 用 程序 的 用 户 可 以 不 必 使 用 PB, 而 是 使 用 由 芯片 COEM) 厂 商 提 供 的 基于 特定 芯 
片 开 发 硬件 平台 的 SDK, 或 是 使 用 微软 提供 的 Embedded Visual C 十 十 ,或 是 Visual 
Studio 2005 。 

建立 一 个 基于 WinCE 的 OS 设计 必须 完成 下 列 基 本 步 又 : 

@ 开发 一 个 板 级 支持 包 (BSP) ,以 支持 由 硬件 部 门 所 设计 的 特定 的 目标 设备 。 

@ 创建 一 个 操作 系统 设计 (an OS design), 它 基于 一 个 标准 的 板 级 支持 包 (BSP) 或 是 定 
做 的 BSP( 这 在 第 中 步 完成 ) 。 这 个 OS 设计 可 以 产生 一 个 运行 时 贞 像 , 它 可 以 被 下 载 到 一 个 
标准 的 开发 板 (SDB) 或 一 个 硬件 平台 上 。 

@@ 为 特定 的 目标 板 级 支持 包 (BSP) 设 计 或 定制 设备 驱动 。 
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氢 @@ 定制 该 OS 设计 ,为 之 增加 一 些 项 目 工程 或 是 组 件 目录 条 目 (catelog items) 。 
你 @ 编译 产生 运行 时 映像 ,下 载 到 SDB, 使 用 PB 所 带 的 集成 开发 环境 进行 调试 并 做 修改 。 
较 图 当 运 行 时 映像 调试 完毕 ,达到 期 望 的 性 能 之 后 ,由 PB 导出 一 个 软件 开发 包 (CSDK) ,以 
件 | 用 于 第 三 方 开发 更 多 的 应 用 软件 。 
设 由 图 11 -1I 可 以 看 出 ,早期 设计 主要 是 集中 在 BSP 设备 和 驱动 的 开发 上 ,用 以 驱动 目标 
这 | 设备 中 的 各 个 硬件 模块 正常 工作 。 所 以 第 一 个 阶段 是 整个 系统 的 骨干 核心 系统 的 控制 和 最 基 


本 设备 的 引导 阶段 。 这 个 阶段 开发 的 软件 叫做 BSP。 
六 Wows cp 列 全 开 和 的 工作 
210 硬件 锯 备 启动 引导 OS 平台 开发 WinCE 应 用 开发 ” 


| 硬件 设计 开发 定制 的 驱动 

定制 的 WinCE 
测试 与 集成 

| | 加 载 ROM 赂 控 程序 上 9 组 件 目录 条 目 


在 设备 上 引导 最 小 的 : | 
| 测试 与 集成 | 


开发 和 集成 组 件 及 其 
目录 条 目 
测试 与 集成 


11-1 WinCE OS 开发 的 工作 流程 


第 二 个 阶段 是 平台 的 开发 。 在 平台 开发 阶段 ,需要 在 BSP 的 基础 之 上 ,开发 更 多 的 设备 
驱动 ,以 使 操作 系统 支持 更 加 丰富 多 彩 的 外 围 设备 ,它们 是 对 一 个 最 基本 的 操作 系统 的 扩展 ， 
用 以 支持 更 多 的 、. 可 选 的 外 围 设备 。 事 实 上 ,BSP 中 已 经 包含 了 很 多 基本 的 驱动 (driver), 例 
如 基本 的 输入 /输出 接口 ,从 而 使 得 系统 可 以 接收 用 户 的 键盘 输入 ,定位 点 输入 ,显示 设备 可 以 
显示 基本 的 Logo, 调 试 接口 可 以 打印 出 一 些 警 示 信息 。 

在 设备 驱动 开发 .系统 不 断 丰富 完善 的 阶段 ,需要 不 断 地 测试 系统 ,把 新 的 软件 组 件 增加 
集成 到 系统 中 。 同 时 还 需 增 加 一 些 配置 信息 ,以 使 PB 可 以 图 形 化 地 管理 这 些 软件 组 件 ,避免 
手动 地 在 命令 行 中 去 编译 .复制 和 打包 新 的 软件 组 件 。 这 些 配置 信息 还 包括 注册 表 信息 内存 


布局 .OS 映像 布局 和 内 存 文 件 系 统 布 局 等 。 

第 三 阶段 是 应 用 程序 的 开发 。 在 这 个 阶段 中 ,应 用 程序 员 致力 于 解决 各 种 实际 应 用 问题 。 

这 与 在 通常 的 Windows 下 开发 各 种 应 用 程序 非常 类 似 。 不 同 之 处 仅 在 于 后 者 是 通用 的 Intel 软 

x86 架构 ,微软 Windows 操作 系统 平台 下 的 应 用 ,而 前 者 则 是 在 种 类 繁多 的 CPU ,以 及 各 种 各 “| 件 
| 


样 的 硬件 平台 上 ,在 嵌入 式 操作 系统 平台 上 开发 应 用 ,特别 地 ,后 者 需要 使 用 不 同 的 交叉 编译 c| 设 
开发 工具 ,或 是 特定 的 SDK 进行 开发 和 编译 。 ， 
人 

11.1.2 ”WinCE 内 核 结构 是 
图 11 -2 显示 了 WinCE 的 内 部 层次 结构 。 其 中 最 上 层 是 应 用 层 (Application Layep, 它 “| 六 


包括 微软 预先 开发 握 供 的 标准 应 用 程序 ,如 :互联 网 客户 端 服务 (Internet Client Services)， | 洒 
WinCE 应 用 程序 ,用 户 接口 (国际 化 语言 支持 等 ) 以 及 客户 端 自主 开发 定制 的 应 用 程序 。 


Wiaaow CE 体系 结构 


定制 的 应 用 程序 


| Intemet 客户 与 服务 


应 用 和 服务 的 开发 操作 系统 层 
核心 动态 库 (DLL) 对 象 存储 


设备 管理 器 
ee > 0 人 《 Device 
本 (GWES) Manager) 


核心 动态 库 (DEL) 


图 11-2 WinCE 的 内 部 层次 结构 
中 间 层 是 操作 系统 层 , 它 是 微软 维护 的 操作 系统 核心 。 操 作 系 统 核心 的 上 层 是 应 用 编程 
接口 (API) ,内 部 是 各 种 各 样 的 核心 DLLs 以 及 各 种 各 样 的 程序 组 件 库 , 诸 如 :多 媒体 技术 
(multimedia technologies) ,图 形 窗 口 和 事件 系统 (GWES) ,设备 管理 器 (device manager), 通 
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信服 务 和 网 络 。 

由 于 操作 系统 是 基于 特定 的 OEM 厂商 提供 的 硬件 平台 ,操作 系统 核心 的 部 分 程序 需要 
根据 硬件 特性 进行 定制 。 

下 层 是 OEM 层 , 它 包括 :OEM 适应 层 (OEM Adaptation Layer) ,设备 驱动 (driver) ,启动 
加 载 器 (boot loader) ,配置 文件 (configuration files) 。 

最 底层 是 硬件 层 (hardware layer) 。 


11.1.3 WinCE 设计 中 的 一 些 名 词 术语 


为 了 弄 清 楚 WinCE 设计 的 关键 概念 ,下 面 介 绍 WinCE 开发 的 几 个 术语 。 

1. 组 件 的 目录 条 目 

WinCE 开发 平台 是 一 个 庞大 的 软件 体系 , 它 不 但 支持 多 种 CPU 体系 (CISC,RISC) ,而 且 
支持 多 个 厂商 的 BSP 所 共用 或 是 专用 的 程序 软件 。 为 了 便于 管理 大 量 的 软件 组 件 模块 ,PB 
通过 各 种 配置 文件 来 组 织 和 管理 源 程 序 文件 ,编译 选项 开关 ,映像 位 置信 息 。PB 通过 读 取 一 
类 特殊 的 配置 文件 (*. cec) 来 组 织 某 一 个 特定 平台 中 的 软件 组 件 。 它 使 得 某 个 图 形 组 件 在 
PB 里 能 够 进行 可 视 化 管理 ,可 以 进行 单独 选择 ,添加 到 一 个 OS 设计 中 。 目 录 条 目 (catalog i 
tem) 就 是 指 这 些 任 何 一 个 可 以 在 PB 里 被 选择 的 组 件 条 目 。 

2. 0OS 设计 模板 

通常 SoC 芯片 集成 了 丰富 的 外 围 设备 控制 器 以 及 大 量 数目 的 GPIO。 因 此 ,一 个 SoC 芯 
片 通过 配置 不 同 的 外 围 设备 来 开发 不 同 的 应 用 软件 ,从 而 使 这 块 SoC 芯片 用 于 设计 制造 各 种 
应 用 产品 。 

一 般 地 ,BSP 是 基于 标准 的 开发 板 (SDB)? 而 开发 的 通用 软件 包 。 通 过 在 这 个 软件 的 基础 
之 上 进行 剪裁 ,从 而 可 以 支持 不 同 的 应 用 ,所 以 可 以 通过 预先 的 定制 来 产生 具有 各 种 特色 的 操 
作 系 统 映像 ,这 就 是 OS 设计 模板 (design templete) 。 

3. 0OS 设计 

”一 个 操作 系统 (OS) 设 计 是 一 系列 组 件 目录 条 目的 集合 体 , 它 定义 了 一 个 操作 系统 的 所 有 
特点 。 可 以 基于 一 个 操作 系统 设计 模块 来 定制 一 个 操作 系统 , 当然 也 可 以 不 必 基 于 某 个 设计 
模板 而 从 头 开 始 设计 一 个 操作 系统 。 一 个 操作 系统 设计 对 应 于 一 系列 “Sysgen” 变 量 的 集 
合体 。 

4. 运行 时 映像 

操作 系统 运行 时 映像 (run - time image) 并 不 单纯 包含 一 个 WinCE 操作 系统 和 其 他 一 些 
相关 的 系统 程序 .配置 文件 以 及 应 用 软件 等 。 

s. 组 件 

可 以 增加 到 OS 设计 中 最 小 的 功能 单元 。 
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6. 配 置 

在 OS 设计 中 ,从 组 件 的 目录 树 里 选择 一 系列 要 添加 到 OS 的 组 件 条 目 (catalog items) ,以 及 
设置 一 系列 的 编译 选项 。 它 们 总 称 为 操作 系统 (OS) 设 计 的 一 个 配置 (configuration) 。 

7. 硬件 平台 

SoC 及 其 外 围 设 备 所 组 成 的 一 个 产品 的 所 有 硬件 系统 。 在 硬件 平台 (hardware platform) 
上 将 可 以 运行 WinCE 操作 系统 ,以 及 其 他 应 用 软件 。 

8. 模 块 

在 WinCE 中 ,模块 (module) 指 组 成 一 个 OS 系统 映像 的 可 执行 文件 (* .EXE) 或 者 一 个 
动态 链接 库 (* . DLL) 。 一 个 软件 就 是 一 个 可 以 独立 执行 的 软件 组 成 部 分 。 

9. 工 程 

在 WinCE 的 设计 中 ,工程 (project) 指 对 一 个 集合 文件 的 管理 和 跟踪 机 制 。 在 这 个 工程 中 ， 
编译 器 可 以 通过 编译 工程 中 的 所 有 文件 来 产生 WinCE OS 的 一 个 功能 组 件 (a functionality) 。 

10. 目标 设备 .基于 WinCE 的 设备 

目标 设备 (target device) 实 例 指 一 个 硬件 平台 (hardware Platform) 的 实例 。 基 于 WinCE 
的 设备 (WinCE-based Device), 则 是 指 运行 WinCE OS 的 一 个 目标 设备 。 

11. OS 工作 平台 

它 是 一 个 OS 设计 的 所 有 文件 的 容器 , 即 OS 设计 的 所 有 文件 包含 在 OS 的 一 个 工作 平台 
(workspace) 中 。 

把 OS 看 成 一 个 巨大 的 工程 项 目 , 则 这 个 巨大 工程 项 目的 工程 平台 就 是 OS 工作 平台 。 在 
OS 工作 平台 里 ,还 可 以 对 各 个 功能 组 件 设置 单一 的 工程 管理 , 那 即 是 工程 (project)。 也 就 是 
说 OS 工作 平台 里 可 以 包含 多 个 工程 , 某 个 工程 可 能 是 一 个 驱动 模块 ,或 者 是 一 个 用 户 应 用 
程序 。 


11.2 WinCE BSP 开发 


WinCE 的 板 级 支持 包 由 4 个 部 分 组 成 :启动 装载 器 (boot - loader) ,OEM 适 配 层 ,设备 驱 
动 和 配置 文件 。WinCE BSP 框图 如 图 11-3 所 示 。 


11.2.1 启动 装载 器 


Boot -loader 的 作用 ,如 名 字 所 示 ,第 一 是 Boot, 完 成 对 硬件 平台 最 小 的 初始 化 ,初始 化 内 
存 ; 第 二 是 Loader, 即 将 操作 系统 二 进 制 映像 装载 到 内 存 并 跑 转 到 操作 系统 的 起 始 执行 函数 。 
SDB(Standard Development Board ,标准 开发 板 ) 是 指 CE 所 运行 的 硬件 开发 平台 。 
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SDB (标准 开发 板 ) 


11-3 WinCE BSP 框图 


Boot - loader 可 以 从 多 种 方式 下 载 操 作 系 统 , 例 如 :通过 一 个 与 SDB 相连 的 连接 线 缆 ( 比 
如 :以 太 网 ,USB, 串 口 等 )。Boot - loader 也 可 以 从 本 地 存储 空间 加 载 操 作 系 统 , 例 如 :CF 卡 ， 
Flash ,或 是 硬盘 。 ， 

Boot - loader 一 般 用 于 开发 期 间 快 速 地 下 载 操作 系统 , 它 也 包含 于 OEM 产品 中 。 但 在 
实际 的 单个 产品 设备 中 ,Boot - loader 可 能 被 去 除 掉 , 而 由 设备 中 的 一 个 简单 的 引导 器 将 系统 
从 本 地 存储 设备 中 进行 加 载 。 但 对 于 需要 作 预 先 初始 化 并 提供 软件 升级 之 类 需求 的 产品 设 
备 ,Boot -loader 仍然 可 能 包含 于 产品 设备 中 。 

1，Boot-ioader 的 启动 流程 

中 CPU 早期 的 初始 化 

国 进入 特权 模式 ; 

国 清除 ICache,D-cache; 

国 清除 TLB 缓冲 ; 

国 清除 写 和 读 缓 冲 (drain the write and fill buffers) ; 

图 配置 和 使 能 RAM 控制 器 ; 

国 确保 中 断 被 清除 和 屏蔽 ; 

熏 初始 化 所 有 必须 的 锁 相 环 (PLLs-Phase locked Loops) ,以 及 时 间 基 准 , 如 RTC, 和 滴 赎 

计数 器 。 

@ (可 选 地 )? 重 定位 Loader 代码 映像 到 RAM。 了 Boot-loader 在 Reset 之 后 可 能 运行 于 
Flash 。 

图 〈 可 选 地 ) 使 能 MMU 和 Cache。 


注意 :MMU 和 Cache 关 掉 也 是 可 以 工作 的 ,这 需要 在 OS 的 config. bib 文件 中 内 存 的 配 
置 时 考虑 这 个 因素 。 
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@@ 复制 数据 段 到 它 最 终 的 位 置 。 

@@ 早期 的 板 级 初始 化 。 

国 设置 调试 的 UART:; 

灵 〈 可 选 地 ) 提 供 Loader 选项 的 用 户 菜单 ; 

由 初始 化 以 太 网 控制 器 。 

@ 曙 〈 可 选 地 ) 从 DHCP 服务 器 获得 IP 地 址 或 者 指定 静态 卫 地 址 。 

G@) 初始 化 TFTP 连接 ,Platform - Builder 使 用 TFTP 协议 从 开发 工作 站 主机 下 载 * .bin 
文件 。 

将 一 个 大 的 * .bin 文件 折 成 一 些 独立 的 小 片段 ,每 个 片段 使 用 一 个 记录 条 目 进行 下 
载 。 各 个 记录 条 目 都 有 一 个 校 验 和 ,从 而 可 以 有 效 地 检验 数据 的 正确 性 。 数 据 下 载 后 按 记录 
条 目 中 指定 的 地 址 进行 存放 。 

@ 从 Platform-Builder 获得 各 种 各 样 的 用 户 配 置 ,例如 :boot clean, 或 者 是 否 建 立 一 个 被 
动 的 KITL 连接 以 及 IP 和 端口 地 址 ,以 用 于 多 个 PB 服务 器 的 连接 。 

晶 执行 下 载 的 * . bin 文件 。 

2.Boot-loader 开发 


从 上 述 的 启动 流程 ,可 以 大 致知 道 Boot - loader 所 需要 开发 的 工作 。 即 启动 过 程 中 所 要 
执行 的 各 个 例 程 , 它 们 也 就 是 BSP 所 需要 开发 的 范畴 。WinCE 源码 中 提供 了 主要 框架 和 大 
部 分 与 CPU 相关 的 源码 。 而 OEM 开发 者 只 需要 开发 那些 与 平台 相关 的 软件 。 这 包括 ; 

国 板 级 最 基本 的 硬件 初始 化 RAM 控制 器 ,PLLs, 系 统 控制 寄存 器 , 重 定位 寄存 器 ; 

册 UART; 

量 Ethernet 驱动 ; 

笨 用 户 界 面 ; 

国 Flash 读 写 扩 除 等 的 驱动 。 


11.2.2 OAL 开发 


创建 一 个 OAL 包含 如 下 任务 与 步骤 。 

1. 创建 一 个 新 的 平台 目录 和 OAL 子 目录 

例如 : 

Platform 目录 : %_WINCEROOT%ANPlatformNMyPlatform 

OAL 目录 : %_ WINCEROOT %NPlatformN\MyPlatformNKerneINHal 

需要 把 这 些 目录 包含 在 dirs 文件 中 , 以 便 平 台 编 译 的 时 候 , 它们 作为 平台 编译 的 一 部 分 
自动 编译 。 
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is 


2. 在 OAL 中 实现 StartUp 函数 

一 般 地 , StartUp 函数 初始 化 CPU 核心 .SDRAM 控制 器 ,内存 管 理 单元 (MMU) 以 及 
Caches。 这 个 函数 完成 这 些 工 作 , 为 WinCE 内 核 的 运行 做 准备 。 可 以 与 Boot-loader 共享 这 
部 分 代码 。 典 型 地 ,这 部 分 代码 可 以 从 微软 提供 的 平台 开发 样 例 中 获取 参考 。 

3. 创建 sources 和 makefile 文件 

创建 这 些 文件 用 以 编译 StartUp 函数 。 

WinCE 编译 的 过 程 是 由 Makefile 以 及 一 些 构建 配置 信息 来 驱动 的 ,比如 :CDEFINES， 
include 文件 以 及 library 文件 的 路 径 。 可 以 使 用 一 个 单一 的 Sources 文件 来 编译 OAL 为 一 个 
单一 的 库 Hal, lib, 它 在 后 期 编译 阶段 中 将 被 连接 到 内 核 (kernel) 的 一 部 分 。 

4. 创建 内 核 Buildexe 目录 以 及 Dirs 文件 

创建 内 核 Buildexe 目录 以 及 Dirs 文件 ,以 指示 编译 的 进程 。 

WinCE 内 核 是 一 个 * . exe 执行 文件 ,是 在 BSP 编译 进程 的 后 期 被 创建 ,OAL 作为 这 个 

x* .exe 执行 文件 的 一 部 分 。 

WinCE 内 核 有 3 个 变种 :基本 的 内 核 (basic kernel) ,包含 KITL 的 内 核 (kernel with 
KITL) 以 及 分 级 内 核 (profiling kernel) 。 

s. 创建 特定 CPU 相关 的 OAL 函数 

例如 ,对 于 基于 ARM 的 平台 : 

国 OEMARMCacheMode 

国 OEMDataAbortHandler 

国 OEMInterruptHandler 

国 OEMJInterruptHandlerFIQ 

对 于 基于 MIPS 的 平台 : 

国 CacheErrorHandiler 

国 CacheErrorHandler_End 

对 于 基于 x86 的 平台 ， 

国 CacheNMIHandler 


6. 创建 下 列 必须 的 OAL 初始 化 函数 

画 InitClock 

DoPowerOff 必须 使 用 的 例 程 ,但 一 般 地 由 OEMJInit 调用 。 
杜 OEMInit 

国 OEMCacheRangeFljush 

国 OEMGetExtensionDRAM 
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7. 创建 下 列 调试 相关 的 函数 
国 OEMDebugInit 

国 OEMInitDebugSerial 软 
国 OEMReadDebugByte 
国 OEMWriteDebugByte 1 
国 OEMWriteDebugString 


8. 创建 下 列 与 电源 及 工作 模式 相关 的 函数 机 
国 OEMIdle 本 
恒 OFEEMPowerOff 
9. 创建 下 列 中 断 处理 函 数 的 
到 OEMInterruptDisable 217 


国 OEMJInterruptDone 

国 OEMIJInterruptEnable 

10. 创建 下 列 与 实时 时 钟 相关 的 函数 

国 OEMGetRealTime 

国 OEMSetAlarmTme 

国 OEMSetRealTime 

11. 创建 下 列 与 IO 相关 的 阴 数 

本 OFEMIoControl 

国 OEMParallePortGetByte 

于 OEMParallelPortSendByte 

12. 定义 下 列 NK. lib 所 需 的 全 局 变量 

基于 ARM 平台 和 x86 平台 : 

量 OEMAddressTable 

基于 MIPS 平台 : 

全 OEMTLBSize 

13. 编译 内 核 可 执行 映像 Kernkitl. exe 

在 这 个 时 候 , 内 核 映 像 并 不 是 很 有 用 的 ,但 编译 生成 kernkitl. exe 可 以 检验 所 有 的 配置 过 
程 是 正确 的 ,并 建立 了 内 核 的 一 个 基本 框架 。 

14. 实现 上 述 OAL 函数 

.特别 是 对 于 OEMIoControl 函数 ,需要 实现 下 面 的 功能 。 这 些 功能 在 BSP 以 及 驱动 设计 
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的 其 他 地 方 将 要 被 调用 。 列 举 于 下 : 


IOCTL_HRAIL，DDK_CRLD 
IOCTL_HAT，GETBUSDRTR 
IOCTL_HRAI，SETBUSDRTR 
IOCTL_HRAT，DISRBLE_NRKE 
IOCTL_HRL，ENRBLE_NRKE 
IOCTL_HRL，GET_DEVICBE_INFO 
IOCTL_HRI，GET_DEVICEID 
IOCTL_HRL_GET_UUID 
IOCTL_HRAL，GET_WRAKE_SOURCE 
IOCTL_HRI，INIT_RTC 
IOCTL_HRT，INITTREGISTRY 
IOCTL_HAL_POSTINIT 
IOCTL_HRAL， PRESUSPEND 
IOCTL_HRAL，QUERY_DISPLRAYSETTINGS 
IOCTL_HRAL_REBOOT 
IOCTL_HAL_RELERSE_SYSINTR 
IOCTL_HRL_ REOUEST_IRQ 
IOCTL_HRAL，REOUEST_SYSTNTR 
IOCTL，HRI，SRT_DEVICE_INFO 
IOCTL_HRAL_TRRNSLRTE _IRO 
IOCTL_KITI，GET_INFO 
IOCTL_，PROCESSOR_INFORMRTION 
IOCTL_SET_KERNEI，COMM_DEV 
IOCTL_SET_KERNEL_，DEV_PORT 


IOCITL_VBRIDGE_802_3_MULTICRST_EIST 
IOCTL_VBRIDGE_CURRENT_PRCKRT_FILTER 


IOCTL_VBRIDGE_GET_ETHPRRNET_MRAC 
IOCTL_VBRIDGE_GET_RX_PRACKET 


IOCTL_VBRIDGE_GET_RX_PRCKET_COMPLEPTE 


IOCTL_VBRIDGE_GET_TX_PRCKET 


IOCTL_VBRIDGE_GET_TX_PRACKET_COMPLETE 


IOCTL_VBRIDGE_SHARED_ETHERNET 
IOCTL，VBRIDGE_WILD_CRRD 


小 结 : 


这 里 给 出 WinCE OAL 构建 的 基本 框架 ,让 读者 对 WinCE OAL 核心 有 一 个 初步 了 解 , 具 
体 某 个 函数 的 实现 细节 可 以 查阅 WinCE 的 开发 文档 。 在 下 面 的 章节 ,再 对 WinCE 设备 驱动 
的 开发 步骤 向 读者 作 一 个 初步 的 介绍 。 
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11.2.3 WinCE 配置 文件 


WinCE 使 用 2 种 类 别 的 配置 文件 来 构建 WinCE 内 核 映 像 。 一 类 是 源 代 码 配 置 文件 , 另 
一 类 是 内 核 映 像 配 置 文件 。 

1. 源 代码 配置 文件 

在 前 面 Boot-loader 和 OAL 构建 的 过 程 中 ,已 经 向 读者 介绍 了 一 些 与 编译 相关 的 配置 文 
件 , 那 就 是 ， 

国 Dirs 文件 ; 

国 Sources 文件 ; 

硬 Makefile 文件 。 

编译 工具 依赖 于 这 些 源 文件 的 配置 文件 来 确定 由 指定 集合 的 源 文 件 生 成 指定 的 模块 组 
件 ,甚至 于 整个 WinCE 内 核 。 除 此 之 外 ,诸如 Makefile 还 告诉 编译 工具 如 何 来 产生 ,如 何 构 
建 这 些 模块 和 内 核 映 像 。 

关于 Makefile 以 及 这 些 配置 文件 的 细则 这 里 不 再 赣 述 。 

2 内核 映像 配置 文件 

内 核 映 像 配置 文件 包括 内 核 中 包含 的 组 件 , 在 内 存 中 的 布局 以 及 相互 之 间 的 关系 ,各 种 程 
序 配 置信 息 ,配置 参数 ,注册 信息 表 等 所 有 系统 信息 。 

在 OS 的 设计 中 ,这 些 信 息 分 布 在 以 下 几 类 文件 中 : 

辆 *.bib -(Binary Image Builder) 文 件 ; 

国 * .reg -(Registry) 文 件 ; 

国 *. db -数据 库 文件 ; 

国 * . str -字符 串 文件 。 

x .bib 文件 定义 了 在 一 个 OS 映像 中 所 包含 的 模块 和 文件 。 

x .reg 文件 定义 了 在 WinCE 冷 启 动 时 ,9S 映像 创建 时 的 注册 键 及 其 初始 值 。 

< . db 文件 定义 了 在 WinCE 冷 启动 时 ,OS 映像 包含 的 对 象 存 储 的 数据 库 文 件 。 

* , str 文件 中 定义 了 一 些 字符 串 符号 ,以 供 在 * . bib, * .reg,*.db 显示 给 用 户 时 使 用 。 

表 11-1 列 出 了 常见 的 映像 配置 文件 : 

表 11-1 WinCE 常见 的 映像 配置 文件 


Common. bib ，Common. reg ,Common, dat，Common. db ,| 这 些 文件 用 于 所 有 的 工程 ,它们 包含 了 WinCE 核心 的 模 
Common. str 块 和 组 件 


TIE. bib ，IE. reg，IE. dat，]E. db，IE. str 这 些 文件 用 于 IE 工程 
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续 表 11 -1 
作用 范围 


这 些 文件 用 于 WinCE 应 用 项 县 工程 ,它们 包含 支持 
WWceappsfe. bib，Wceappsfe, reg, Wceappsfe. dat，Wceap- 
WordPad 字 处 理 软件 ,以 及 Inbox 消息 处 理 软件 所 需要 的 


组 件 


Weeshellfe. bib， 机 ceshellfe， reg， Wceshelife. dat,| 这 些 文件 用 于 WinCEShellFe 工程 ,它们 包含 支持 基于 
Wceshellfe. db，Wceshellfe. str WinCE Shell 的 模块 


Msmq，bib， Msmq，reg， Msmgq. data， Msmq，db ,| 这些 文件 用 于 MSMEGQ 工程 ,它们 包含 消息 队列 服务 的 
Msmq, str 模块 


psfe. db，Wceappsfe. str 


Platform. bib ，Platform. reg，Platform. dat，Platform. db , 
这 些 文件 用 于 硬件 开发 平台 ,如 设备 驱动 


Platform、str 


Project. bib ，Project, reg ，Project. dat，Project. db ，Pro- 


这 些 文件 用 于 WinCE 平台 中 所 包含 的 工程 


ject. str 


这 个 文件 用 于 OS 映像 。 它 包含 OS 映像 在 内 存 (MEMGO- 
RY) 和 配置 (CONFIG) 状 态 


下 面 描述 一 些 比较 重要 的 配置 文件 。 
(1) Eboot. bib 
下 面 的 代码 片段 显示 Eboot. bib 的 一 个 片段 ; 


Name Stat Size TYPe 

EBOOT 00030000 00030000 RARAMIMRGE 

RARAM 00060000 00010000 RRAM 
它 是 Eboot 在 内 存 中 的 映像 布局 。 


(2) Config,. bib 
下 面 的 代码 片段 显示 Config. bib 的 一 个 片段 ， 


IF IMGEBOOT 
BLDR 88030000 00040000 RESERVED ;CEboot) Bldr 
KK 88070000 01E90000 RRMIMRGE 
RRM 8&R000000 01EE0000 RRM 

ENDIPF 


它 定 义 了 内 核 映 像 在 内 存 中 的 布局 。 
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(3) Platform. bib 
如 果 要 在 WinCE 映像 中 增加 一 个 设备 驱动 , 则 需要 在 platform. bib 中 添加 如 下 条 目 : 
IE BSP_URART 
uart. dl] $(_EFLRATRELERASEDIR)Nuart, dl1 NK SB8 
ENDIE 


(4) Platform. reg 
如 果 要 在 WinCE 映像 中 增加 一 个 设备 驱动 , 则 需要 在 platform. reg 中 添加 如 下 类 似 注册 


信息 : 
IE BSP_URRT 
[LHKEY_LOCRL_MRCHINENDriversNBuiltInNSerial ] 

"D11"” = "uart. d1” 
"DevicearrayIndex"” = dword:0 
"IoBase"”= dword:10001000 
"SysIntr"”= dword:11 
"Prefix”= "COM" 
"Index”= dword:0 
"Order"” = dword:0 

ENDIF 


1 3 WinCE 设备 驱动 的 开发 演 各 


在 第 1 章 中 讲 了 WinCE 的 驱动 模型 ,讨论 了 应 用 程序 与 设备 驱动 ,IO 系统 ,以 及 BSP 
之 间 的 交互 关系 。 在 这 里 介绍 一 下 在 WinCE 中 增加 一 个 新 的 设备 驱动 的 流程 。 


11.3.1 设备 驱动 源 代 码 


第 一 步 工 作 是 编写 设备 驱动 的 源 代码 。 在 第 1 章 中 已 经 介绍 了 驱动 模型 , WinCE 各 种 设 
备 实现 所 需要 的 接口 略 有 不 同 , WinCE 常用 的 设备 种 类 有 


Rudio DriverSs 

Battery DriverSs 

BLock Drivers 

BlLuetooth HCI Transport Driver 
Direct3D Device Driver Interface 
DirectDraw Display Drivers 
Display DriverS 

DVD-Video Renderer 
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IEEE 1394 Drivers 


拟 

人 KeYyboard Drivers 

区 Notification LED Drivers 
软 Paraljiel Port Drivers 
全 PC Card DriverSs 

这 Printer Drivers 

， Serial Port Drivers 

耻 Smart Card Drivers 

想 Stream Interface Drivers 


Touch Screen Drivers 


USB Drivers 


对 于 各 种 类 型 的 设备 , WinCE 定义 了 相应 的 接口 规范 ,一 般 地 ,需要 实现 驱动 的 初始 化 、 
设备 的 创建 与 删除 ,对 设备 操作 的 读 、 写 .控制 等 例 程 以 及 中 断 的 处 理 。 


11.3.2 修改 配置 文件 


1 x .def 文件 
创建 和 编辑 一 个 def 文件 ,这 是 WinCE 动态 链接 库 的 配置 文件 ,指示 对 外 输出 函数 的 接 
口 。 例 如 : 


LIBRRARY aud_ac97 

EXPORTS AUD_Init 
RUD_Deinit 
RAUD_Open 
AUD_Close 
AUD_Read 
RUD_WTrite 
AUD_Seek 
RUD_IOControl 
AUD_PowerDown 
AUD_PowerUp 


2.， 源 程序 配置 文件 


(1) Source 文件 
创建 和 编辑 source 文件 ,指定 编译 选项 ,例如 : 
RELERSETYPE = PLRTFORM 


TRRGETNRME = aud_ac97 
TRRGETTYPE = DYNLINK 
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DEFFILE = aud_ac97. def 嵌 
DLLENTRY = DL1Main 六 
TRRGETLIBS = $ (_COMMONSDKROOT)NlibN $(_CPUINDPRATH)Ncored11. Lib 戒 
SOURCELIBS = $ (_COMMONORKROOT)NlibN $(_CPUINDPRTH)Nceddk. 1ib 软 
INCLUDES = ..\. .NincyN\ 昌 
SOURCES = \\ 计 
aud_ac97.cN\ 2 
aud_sys,cCAN 起 
FILE_VIENW_INCLUDES_FOLDER = aud_ac97.hA\ 活 
1 IE"S$S(BSP_NODISPLRY)"” == "1" 方 
SKIPBUILD = 1 法 
1 ENDIF 
(2) Dirs 文件 人 


编辑 “BSPNdrivers” 下 的 dirs 文件 ,使 之 包括 新 驱动 目录 。 
(3) Makefile 文件 
指定 生成 image 的 选项 ,一 般 包 含 通用 的 编译 规则 文件 。 例 如 ; 


! INCLUDE $ (_MRKEENVROOT)Nmakefile. def 


3. 映像 配置 文件 


(1) 修改 Platform. bib 文件 
修改 OS 平台 的 platform, bib 文件 ,让 内 核 映 像 包 含 指定 的 库 文件 ,例如 


aud_ac97. d1 $ (_RLRATRELEASEDIR)N aud_ac97. dl1 NMK  SH 


(2) 修改 Platform. reg 文件 
修改 OS 平台 的 platform. reg 文件 ,让 内 核 映 像 的 注册 表 中 包含 该 驱动 的 参数 ,例如 ， 
[HKEY_LDOCRL_MRCHINENDriversNBuiltInNCEFC] 

"Prefix”= “RUD” 

"D11"” = "aud_ac97.d]11" 


11.3.3 向 OS 平台 注入 驱动 


最 后 ,介绍 Platform. CEC 文件 ,通过 它 可 以 很 容易 地 在 OS Platform Builder 中 , 把 一 个 
驱动 当 一 个 组 件 加 入 到 系统 中 。 以 便 在 设计 一 个 特定 的 WinCE 操作 系统 (QOS 时 ,灵活 地 加 
和 人 或 排除 某 个 系统 组 件 ,例如 : 某 个 设备 驱动 组 件 。 通 过 * , CEC, 可 以 在 WinCE Platform 
Builder 中 可 视 化 地 拖 和 人 或 删除 某 个 内 核 组 件 。 

如 下 代码 片段 显示 了 在 一 个 平台 中 加 入 “Audio” 组 件 的 示例 ， 
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ComponentTITYPpe 


( 


Name ( "Rudio"”) 
GUID 〈( (48A25R750 -- B641 - 4RF3 -- 9EDEF -- 7CC044108418)} ) 


Description (“"Rudio"”) 


Group ( "\Device Drivers"”) 


Vendor ( "Microsoft”) 

HelpID (477 ) 

MaxResolvedImpsSRAilowed( 999 ) 
ReaquiredCEModules( RLL,， "waveapi device”) 


Inmplementations 


《 


Inplementation 


〈 


Name (“Rudio CODEC" ) 
GUID ( (8D136074 - 1386 -- 49D8 - B1B8 - 2311050646BRF》 ) 
Description ( "OEM Rdvanced Rudio CODEC Interface to National 
Semiconductor LM4549 Rudio chip”) 
BSPPlatformDir (“MyPlat”) 
Version ( "1.0.0.0"”) 
Locale ( 0409 ) 
Vendor ( "OFEM Corp.Ltd”》 
Date ( "2007 -8 一 20")》 
Children (“{(679F95D2 - 0M63 - 485R - RM602 - 1E329R38D452}”) 
Variable( "BSP_WRVEDEV_RRCI" ,"1”) 
SizeIsCPUDependent( 1 ) 
BuildMethods 
《 
BuildMethod 
《 
GUID ( {1B8BRD31 - RE3C - 4729 - 91C8 - 52EE9F64CEB9} ) 
Step ( BSP ) 
CEU ( “RARMV4I"”) 
Rction 〔(“ 提 SRCCODE(SOURCES ,"$ (_WINCEROOT)N 
PLRTEFORMNA $ (_TGTPLRT)NSRCNDRIVERSNwavedev "，"”")) 


2 


前 面 两 篇 详细 讨论 了 舱 人 式 软 件 设计 的 基础 ,以 及 如 何 实际 开发 系统 软件 。 骨 入 式 软件 
的 开发 归根 结 底 是 程序 的 开发 。 前 面 的 章节 都 是 从 用 户 角度 去 编写 程序 ,作为 提高 ,本 章 将 从 
系统 角度 去 考察 一 个 程序 的 内 部 结构 。 在 很 多 时 候 , 程 序 需要 一 些 辅助 的 工具 ,需要 一 些 平台 
的 支持 ,使 得 一 个 静态 的 、 死 的 软件 程序 变 成 活动 的 .可 以 运行 起 来 的 程序 ,这 就 是 常 说 的 进 
程 。 在 系统 程序 中 ,常常 会 碰 到 一 个 可 以 运行 其 他 程序 的 程序 ,例如 :在 Linux 中 的 Shel, 还 
有 平常 不 太 注 意 的 进程 装载 器 (loader) 。 

对 于 其 和 人 式 软 件 程 序 员 而 言 , 深 入 掌握 程序 的 内 部 结构 ,对 于 程序 设计 是 非常 重要 的 。 由 
于 所 开发 的 程序 需要 “ 烧 ”" 到 Flash ,在 运行 时 需要 搬迁 到 内 存 , 甚 至 在 运行 的 过 程 中 需要 移动 
位 置 、. 被 压缩 .解压 缩 以 及 把 一 个 静态 存放 在 磁盘 的 程序 加 载 到 内 存 当 中 ,并 分 别 将 它们 的 代 
码 段 ,数据 段 复制 到 合适 的 位 置 。 必 要 的 时 候 还 可 能 要 与 一 个 动态 库 相 连接 ,从 而 解析 运行 时 
才能 确定 的 一 些 符号 地 址 。 由 此 看 来 ,深入 了 解 程序 ,有 助 于 对 所 设计 的 系统 更 精确 地 控制 。 

那么 ,程序 是 什么 ? 一 个 程序 由 哪 几 部 分 组 成 ? 这 个 看 似 极其 简单 的 问题 ,要 想 真 正 把 它 
弄 清楚 , 却 不 那么 简单 。 

首先 ,无 论 是 应 用 程序 ,还 是 系统 程序 ,它们 都 是 程序 ,也 就 是 说 ,它们 都 是 一 些 指令 代码 
与 指令 所 处 理 的 数据 的 集合 , 即 

程序 一 (代码 十 数据 ) 
代码 是 按照 程序 员 的 设计 意图 设计 出 来 供 CPU 执行 的 指令 序列 。 而 数据 可 以 看 成 是 代 
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码 的 处 理 对 象 . 工 作 状 态 等 的 集合 。 所 以 一 个 程序 由 最 基本 的 代码 段 和 数据 段 组 成 。 

代码 与 数据 在 机 器 中 都 表现 为 0,1 的 二 进 制 序列 ,在 系统 程序 中 ,代码 和 数据 并 不 严格 区 
分 ,因为 作为 代码 的 机 器 表示 ,本身 就 是 数据 序列 。 所 有 的 代码 和 数据 在 初始 时 都 存 于 Flash 
或 是 别 的 存储 设备 中 ,例如 :EEPROM,CF 卡 ,SD 卡 ,或 是 移动 硬盘 。 代 码 都 要 被 复制 到 内 存 
或 者 直接 读 到 CPU 的 指令 队列 之 后 才能 运行 。 

在 创建 一 个 进程 时 ,存储 在 外 部 介质 上 的 代码 会 通过 一 段 叫 Loader (Boot-loader 或 是 实 
用 程序 Ld. exe) 的 软件 工具 ,装载 到 系统 内 存 。 更 进一步 ,程序 在 运行 期 间 可 能 动态 地 改变 代 
码 ,例如 :中 断 向 量 常常 是 通过 将 一 段 处 理 代码 从 一 个 位 置 复制 到 处 理 器 要 求 的 特定 位 置 。 

程序 在 执行 时 由 于 需要 搬迁 ,这 时 需要 编写 位 置 无 关 代 码 (PIC -代码 ) 来 实现 这 一 要 求 。 
在 固件 程序 的 设计 中 ,代码 有 2 个 地 址 ,一 个 是 装 人 地 址 ,一 个 是 执行 地 址 。 在 后 面 将 进一步 
讨论 。 

一 个 程序 除了 代码 段 和 数据 段 之 外 ,为 了 储存 临时 数据 变量 (包括 返回 指针 以 及 程序 状 
态 ) ,一 个 完整 的 程序 还 必须 有 堆栈 段 。 代 码 段 .数据 段 和 堆栈 段 是 一 个 程序 的 基本 组 成 部 分 。 

实际 过 程 中 ,数据 段 有 许多 的 变种 ,例如 常量 数据 ,未 初始 化 数据 ,临时 变量 数据 ,动态 申 
请 数据 等 ,因而 出 现 了 一 些 特殊 的 数据 段 。 这 些 数据 段 有 些 是 在 程序 生成 的 过 程 中 静态 确立 
的 ,而 有 一 些 却 是 程序 在 执行 过 程 中 静态 或 动态 分 配 并 初始 化 的 物理 空间 ,这 就 是 常见 的 BSS 
段 , 以 及 堆 (HEAP) 。 

之 所 以 有 这 些 变种 ,有 2 个 主要 意图 : 

@ 让 系统 中 的 其 他 程序 实体 共享 有 限 的 物理 内 存 资 源 。 

@ 节省 可 执行 程序 在 磁盘 (或 别 的 存储 体 ) 中 的 静态 存储 空间 , 即 目标 程序 的 大 小 。 

下 面 的 章节 将 深入 分 析 这 有 段 程序 段 与 数据 段 如 何 有 序 地 组 织 起 来 ,形成 一 个 独立 且 完 整 
的 程序 。 


12.1 x86 汇编 及 其 程序 结构 


下 面 从 熟知 的 x86 程序 来 考察 一 些 常 见 的 程序 段 。 

(1) 代码 段 

代码 段 (. TEXT) 是 程序 的 执行 体 , 它 是 许多 函数 例 程 的 集合 体 。 一 个 程序 可 能 包含 多 
个 代码 段 ,也 就 是 说 ,它们 在 物理 上 不 一 定 连 续 。 需 要 注意 的 是 ,代码 段 中 并 不 一 定 全 是 执行 
代码 ,一 些 数据 也 可 能 被 放 在 代码 段 ,例如 :一些 常量 数据 在 有 些 体系 中 也 称 Read - Only Seg- 
ment〔〈 只 读 的 段 ) 。 

(2) 数据 段 

数据 段 (. DATA) 是 程序 中 用 到 的 数据 。 链 接 器 (Link. exe) 会 将 程序 源 文件 中 的 数据 链 
接 到 一 起 或 是 链接 到 一 些 大 的 分 块 中 。 一 个 程序 可 能 包含 多 个 数据 段 ,也 就 是 说 ,它们 在 物理 
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上 不 一 定 连续 。 湾 
(3) 未 初始 化 数据 段 入 

未 初始 化 数据 段 (. BSS) 是 数据 段 的 一 类 变种 ,存储 未 初始 化 的 数据 。 未 初始 化 的 数据 不 全 
占有 程序 文件 的 静态 空间 , 它 只 是 在 程序 运行 开始 时 才 在 内 存 中 将 数据 初始 化 为 0。 件 
除了 这 些 静态 的 段 之 外 ,还 有 一 些 运行 时 附加 的 段 ， 设 

(4) 堆 ， 
堆 (. HEAP) 是 用 来 为 程序 动态 分 配 的 存储 空间 。 十 

(5) 楼 想 

栈 (. STACK) 是 为 了 分 配 临 时 变量 和 函数 调用 时 使 用 的 存储 区 域 , 或 工作 区 域 。 ， 
12.1.1 x86 程序 段 定义 法 
下 面 从 一 个 例子 来 考察 x86 汇编 对 于 程序 段 的 定义 。 0 


STRCK SECGMENT STRCK 
DB 32  DUP(?) 
STRACK ENDS 


， DRTR SEGMENT 
MSG1 DB “Hello,world. ,0dh,0ah，5$- 
; ;各 种 数据 项 的 定义 
DRTR ENDS 


CODE SEGMENT 
MRIN PROC FAR 
RSSUME CS， CODE， 


DS ， DRATR 
ES，DRTR 
SS，STRCK 
PUSH 。 DS ; DS 值 人 栈 
MOV MX,0 
PUSH RMX ; 0 人 栈 
MOV MX,DRTR 
MOV  。 DS,RX ;将 数据 段 地 址 赋 给 DS 
MOV 了 S ,MX ;将 数据 段 地 址 赋 给 ES 
MOV MX,4C00H ;返回 DOs 
INT 218 
MRIN ENDP 过 程 结 束 


CODE ENDS ;代码 段 结束 
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ED MIN ;程序 结束 ,启动 地 址 为 MRI 


由 这 里 可 以 看 出 ,一 个 标准 的 汇编 语言 程序 结构 是 由 3 个 段 组 成 的 ,在 源 程 序 中 安排 的 段 
序 是 :STACK,DATA, 然 后 是 CODE ,这 个 段 序 决 定 了 汇编 系统 中 进行 编译 链接 时 ,将 按 段 序 
〈 即 段 排列 的 先后 次 序 ) 来 分 配 存储 区 ,这 也 是 Microsoft 汇编 所 要 求 的 段 序 ,因为 只 有 按 此 段 
序 , 先 分 配 了 变量 和 数据 的 存储 区 ,代码 段 才 能 得 知 其 操作 的 数据 的 地 址 。 

但 是 ,作为 一 个 大 型 的 工程 项 目 , 它 往往 有 很 多 的 模块 ,有 很 多 的 源 文件 。 所 以 其 代码 段 
就 会 有 很 多 片段 ,数据 段 .堆栈 段 也 如 此 。 由 于 段 与 段 之 间 存 在 相互 调用 的 关系 ,那么 如 何 来 
安排 它们 的 先后 顺序 呢 ? 于 是 便 产 生 了 段 组 以 及 结合 类 型 的 概念 ,一 个 段 定义 的 完整 格式 如 
图 12-1 所 示 

段 名 ”SSEGMENT 边界 类 型 ”结合 类 型 ”USE “类 别 ? 


ee 


12-1 x86 汇编 段 结构 


其 中 段 名 为 定义 段 的 名 字 ,该 名 字 可 以 是 唯一 的 ,也 可 以 和 程序 中 的 其 他 段 同名 ,在 同一 
程序 ,中 同名 的 段 就 可 看 做 是 同一 个 段 。 这 种 方式 常用 在 模块 化 程序 结构 中 ,同一 段 的 不 同 部 
分 ,分 别 放 置 在 不 同 的 子 模块 中 ,在 各 子 模块 中 ,这 些 不 同 部 分 具有 同一 个 名 字 , 表 示 的 是 同一 
个 段 。 

边界 类 型 .结合 类 型 `\USE 和 类别? 都 是 可 选项 , 它 用 来 告诉 链接 程序 如 何 对 段 进 行 


《1) 边界 类 型 
边界 类 型 表示 段 开 始 地 址 的 对 齐 位 置 , 有 如 下 几 种 方式 : 
量 BYTE 一 一 表示 段 开 始 地 址 位 于 字 节 地 址 ,因此 它 可 以 起 始 于 任意 边界 。 
量 WORD 一 一 表示 段 开始 地 址 位 于 偶数 地 址 , 即 字 (16 位 ?地址 边界 。 
国 DWORD 一 一 表示 段 开始 地 址 位 于 4 的 倍数 , 即 双 字 (32 位 ) 地 址 边界 。 
国 PARA 表示 段 开 始 地 址 位 于 16 的 倍数 。 
国 PAGE 一 一 表示 段 开 始 地 址 位 于 256 的 倍数 。 
边界 类 型 表示 了 在 存储 区 如 何 连续 地 存放 各 个 段 , 段 间 有 无 间隙。 该 项 一 般 省 略 ,边界 类 
型 默认 时 是 PARA 型 的 。 
(2) 结合 类 型 
结合 类 型 是 告诉 链接 程序 ,该 段 和 其 他 段 的 结合 关系 ,链接 程序 可 以 将 不 同 模块 的 同名 段 
进行 结合 ,根据 结合 类 型 ,可 将 各 段 链接 在 一 起 ,或 重 至 在 一 起 ,结合 类 型 有 以 下 几 种 : 
国 NONE 一 一 表明 本 段 与 其 他 各 段 在 逻辑 上 不 发 生 关系 , 当 结 合 类 型 项 省 略 时 , 便 指 定 
为 这 一 缺少 类 型 。 有 些 编译 器 使 用 关键 字 PRIVATE 来 定义 这 种 类 型 。 
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国 PUBLIC 一 一 表示 将 所 有 该 类 型 的 同名 段 链接 成 一 个 连续 的 段 ,公用 一 个 段 地 址 ,所 有 | 丢 
的 原 各 分 段 内 的 偏 移 都 转变 成 相对 于 连续 段 的 开始 地 址 的 偏 移 量 ,运行 时 装 和 人 同一 物 、 
理 段 中 。 式 

国 STACK 一 一 表示 该 段 为 堆栈 段 , 当 进行 链接 时 同名 的 堆栈 段 链接 成 一 个 连续 段 ,链接 “| 件 
方式 同 PUBLIC ,但 不 同 的 是 连续 段 的 段 地址 是 放 在 SS 段 寄 存 器 中 , 当 用 STACK 类 | 设 
型 说 明 后 ,SS 就 自动 初始 化 为 堆栈 段 的 段 地 址 。 1 

量 COMMON-- 一 表示 所 有 该 类 型 的 同名 段 都 有 相同 的 段 地 址 ,这 些 同 名 段 可 相互 覆盖 。 | 二 
段 长 度 为 其 中 最 长 的 同名 段 的 长 度 ,利用 这 种 同名 段 的 链接 法 ,可 使 不 同 模块 的 变量 ”| 想 
或 标号 使 用 同一 存储 区 域 ,便于 模块 间 通信 或 进行 信息 交换 。 也 

国 MEMORY 一 一 表示 将 所 有 该 类 型 的 同名 段 链接 成 一 个 连续 段 ,其 处 理 同 PUBLIC 段 。 | 法 
虽然 链接 程序 不 单独 区 分 MEMORY 类 型 ,但 MASM 仍 允 许 使 用 该 类 型 ,以 使 得 和 
INTEL 公司 汇编 程序 的 MEMORY 类 型 兼容 。 2 

国 AT 地 址 表达 式 一 一 表示 该 段 地 址 以 地 址 表达 式 的 值 为 段 地 址 , 段 内 标号 和 变量 地 址 
均 以 该 地 址 进行 确定 。 这 由 用 户 给 段 定 义 地 址 的 方式 ,但 这 种 方式 不 能 用 于 代码 段 。 

(3) USE 类 型 

这 是 为 支持 32 位 段 而 设置 的 属性 。16 位 x86 CPU 默认 的 是 16 位 段 , 即 USE16, 而 32 

位 x86 CPU 指令 默认 彩 位 段 , 即 USE32, 但 可 以 使 用 USE16 指定 标准 的 16 位 段 。 编 写 运行 
实地 址 方式 (8086 工作 方式 ) 的 汇编 语言 程序 ,必须 采用 了 16 位 段 。 

(4) “类 别 ' 属 性 

当 链 接 程 序 组 织 段 时 ,将 所 有 的 同类 别 段 相 邻 分 配 。 段 类 别 可 以 是 任意 名 称 ,但 必须 位 于 

单 引 号 中 ,大 多 数 MASM 程序 使 用 'CODE ,DATA?,'STACK' 来 分 别 指明 代码 段 、. 数 据 段 
和 堆栈 段 ,以 保持 所 有 代码 和 数据 的 连续 。 
下 面 来 看 一 个 实际 的 例子 ; 


STRCK 。。 SEGMENT STRCK ; 结合 类 型 是 STRACK 
DB 32 ”DUP(?) 


DRTR SEGMENT COMMON ; 结合 类 型 是 COMNMON 
DRTR1 DB 64 “ DUP(?) 
DRTR ENDS 


CODE SEGMENT PUBLIC ; 结合 类 型 是 PUBLIC 
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设 STRCK 。。 SEGMENT STRCK 
计 DB 48 ” DUP(?) 
之 STRCK ENDS 
注 
人 DRTR  。 SEGMENT COMMON 
人 Daral 。 DB 96 DOUP(?) 
方 DRTR ENDS 
法 CODE SEGMENT PUBLIC 
230 CODE ENDS 

END 


当 汇编 链接 时 ,存储 区 域 映像 如 图 12 - 2 
所 示 。 

两 个 模块 中 的 堆栈 段 的 结合 类 型 为 DATA 
STACK 类 型 , 它 跟 PUBLIC 类 似 ,它们 将 链接 xie| 
成 一 个 连续 段 , 共 用 一 个 段 地 址 。CODE 段 的 结 
合 类 型 也 都 是 PUBLIC, 所 以 它们 也 被 链接 成 一 
个 连续 段 。 而 数据 段 的 结合 类 型 是 COMMON， 
这 2 个 模块 中 的 数据 段 将 相互 重 和 ,其 长 度 为 模 
块 2 的 数据 段 的 长 段 ,因为 在 这 里 ,模块 2 的 数 12 - 2 安 汇编 中 的 段 链接 映像 
据 段 比 模块 1 的 数据 段 要 长 。 


12.1.2 ”关联 段 寄 存 器 确定 段 的 种 类 


ASSUME 语句 是 一 条 伪 指 令 , 它 只 是 告诉 编译 器 在 汇编 代码 的 时 候 指 定 合适 的 段 寄 存 
器 (CS,DS,ES,SS 等 )。 段 定义 SEGMENT 伪 指 令 只 是 说 明了 各 逻辑 段 名 字 和 起 止 位 置 以 及 
属性 ,而 ASSUME 语句 则 说 明了 各 逻辑 段 的 种 类 。 只 有 把 这 些 段 跟 特定 的 段 寄 存 器 联系 起 
来 ,才能 确定 段 的 种 类 。 


12.1.3 段 组 伪 指 今 


MASM 汇编 程序 允许 程序 员 定 义 多 个 同类 型 段 ( 代 码 段 ,数据 段 ,堆栈 段 )。GROUP 斧 
指令 允许 将 同类 型 的 段 组 织 在 一 起 ,它们 都 使 用 同一 个 起 始 地 址 ( 段 地 址 ?来 作为 基 址 ,所 有 的 
段 都 以 这 个 基 址 来 计算 相对 偏 移 来 寻 址 。 


模块 2 的 数据 段 
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段 组 中 各 段 间 不 一 定 连续 ,它们 之 间 可 以 穿插 到 不 是 该 段 组 中 的 的 其 他 段 。 由 于 段 组 中 
的 所 有 段 都 采用 同一 个 段 基 址 来 寻 址 ,所 以 段 组 的 总 长 度 不 得 超过 64K 字 节 。 
段 组 的 定义 如 图 12 - 3 所 示 : 
段 组 名 GROUP 段 名 世 役 名 ， pp] 


图 12-3 x86 段 组 定义 

定义 段 组 后 ,OFFSET 操作 符 取 变量 和 标号 则 是 相对 于 段 组 的 偏 移 地 址 ,如 果 没 有 段 组 
的 定义 , 则 取得 相对 于 段 的 偏 移 地 址 。 

在 这 里 不 过 多 地 去 讨论 x86 汇编 程序 段 的 组 织 结构 ,有 兴趣 对 这 方面 深入 了 解 的 读者 ,请 
参阅 相关 的 x86 汇编 方面 的 书籍 。 

虽然 这 里 的 讨论 是 针对 于 汇编 程序 ,但 对 于 诸如 C 或 C 十 十 之 类 的 高 级 语言 ,同样 也 是 由 
这 些 段 组 成 的 ,只 不 过 那里 关于 段 和 段 组 的 定义 更 多 地 采用 了 默认 值 , 而 由 编译 器 隐 式 地 设 
置 了 。 

小 结 : 

上 面 讨论 了 大 家 熟知 的 x86 中 段 的 结构 以 及 它们 的 组 织 关 系 。 由 此 看 出 ,x86 中 关于 段 
的 组 织 信息 分 布 在 各 个 源 文件 中 , 段 的 起 始 位 置 通过 类 似 于 ORG 这 样 的 伪 指 令 来 指示 。 这 
种 分 布 式 的 管理 不 利于 大 型 系统 的 配置 管理 。 在 艇 入 式 系 统 中 ,程序 片 侦 有 更 加 精确 的 集中 
式 管 理 方式 ,从 而 程序 员 可 以 非常 灵活 方便 地 管理 诸如 Linux 这 样 的 系统 内 核 ,精确 地 控制 它 
们 在 内 存 执行 映射 中 的 位 置 。 


人 


如 下 所 述 ,Microsoft 早期 的 段 结构 从 组 织 上 来 看 是 一 种 分 散 性 的 管理 ,各 种 结构 属性 遍 
布 于 各 个 模块 中 。 在 一 个 大 型 系统 中 管理 这 些 段 片段 ,对 于 系统 设计 的 人 来 说 增加 了 许多 难 
度 。 本 节 将 讨论 现代 的 程序 系统 对 于 程序 布局 的 管理 ,它们 可 以 精确 地 定义 代码 或 数据 的 位 
置 以 及 工作 地 址 ,集中 组 织 各 个 模块 ,从 而 便于 系统 的 管理 和 维护 。 


12.2.1 多 入 式 系 统 中 执行 程序 的 映像 


下 面 先 看 一 段 简单 的 MIPS 汇编 程序 ,以 及 由 这 段 程 序 编译 链接 之 后 所 生成 目标 文件 的 
符号 表 来 考察 一 个 戏 人 式 软件 中 ,一 个 可 执行 程序 映像 的 内 部 布局 。 

本 小 节 采 用 MIPS 汇编 作为 例子 ,如 果 读 者 不 熟悉 MIPS 汇编 也 不 要 紧 , 完 全 可 以 不 关心 
具体 的 指令 以 及 语法 ,只 需要 看 看 程序 的 大 致 结构 。 为 了 简化 ,在 这 个 简单 的 例子 中 没有 定义 
数据 段 (. data) 。 
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柯 include “regs.h”" 
提 include "common. h” 
. Set noat 


. Set noreorder 


.七 ext 
.globl start 
. ent Statt 
Start， 
LOGUESTRRT 
OIL 4$40,$40,0 


捍 间 井 井 间 井 提 提 井 间 间 提亲 提亲 提亲 间 井 间 间 并 提 提 间 井 井 井 井 间 并 提亲 间 井 提 间 井 间 并 间 间 间 间 提亲 提 打 间 提 


# 标记 Ja 测试 


# 因为 在 跳 转 延 时 槽 ,这 句 应 该 被 执行 
# 因为 跳 转 这 句 不 应 该 被 执行 


提 间 间 提 间 井 井 间 井 间 井 提 间 间 提亲 间 提 间 间 井 间 间 井 井 提 音 间 间 间 井 间 间 间 间 提 提 间 间 提亲 间 间 提亲 井 间 打 井 提 


井 J TEST 
OIL t2,$0,0xl000 
]j j 
addiu t2 ,t2 ,0x0001 
addiu t2 ,t2 ,0x0002 
jl1: Jui t3 ,0x0000 
OIL t3 ,t3 ,0x1001 
bne 七 2 ,七 3 ,fail 
OF1L s4,t2,0 
井 JaAL TEST 
ori .t2，$0,0x2000 
OFi ray$0,0 
jal ]j2 
addiu t2 ,t2 ,0x0001 
L1:， addiu t2 , 古 2 ,0x0002 
1ui t3 ,0x0000 
Or 字 t3 ,t3,0x2003 
bne t2 ,t+3 fail 
OIL $0,$0,0 
beq $0,$0,jalzrl 
OII $0,$0,0 
j2; Jui t3,0x0000 


Ori t3 , 夺 3,0x2001 


# 标记 JaL 测试 


井 init ra 


# 返回 地 址 被 存在 r31 
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bne 七 2 , 芋 3 ,fail 氢 
ori $0,$0,0 入 
jrlra 提 跳 转 到 标号 II 式 
ori $0,$0,0 软 
提 柑 间 间 间 井 间 井 间 间 井 间 提 间 井 提亲 间 间 井 井 提 并 井 间 井 井 间 间 并 井 井 间 间 间 井 提 间 并 间 井 提亲 井 间 间 提 间 井 提 上 
井 JRLR TEST 计 
Jalrl: | 了 
ori t2,$0,0x4000 # 标记 JaLR 测试 有 思 
Ori ray$0,0 提 init ra 外 
jal 33 
addiu t2 ,t2 ,0x0001 刀 
法 
L2 : addiu 二 2 ,二 2 ,0x0002 
lui t3 ,0x0000 233 
OFI t3 ,t3 ,0x4003 
bne 七 2 ,七 3 , fail 
Ori $0,$0,0 
j s0 井 应 该 跳 转 到 “end” 
OF1i $0,$0,0 
j3: jlui t3，0x0000 井 跳 转 到 j3 之 后 ,返回 地 址 (link) 存 放 在 r31 
OFri t3,t3 ,0x4001 
bne 七 2 ,t3 , fail 
OIL $0,$0,0 
jalr S0 ,Ia 井 跳 转 到 L2, 返 回 地 址 (link) 存 放 在 r16 
Ori $0,$0,0 
end: addiu t2 ,t2 ,0x0004 
1ui 上 上 3，0x0000 
OFII t3,t3，0x4007 
bne 十 2 ,七 3 , fail 
OFi $0,$0,0 
b pass 
Subroutine: 
addiu t2 ,tt2,0x0002 
addiu 七 7 ,Tay4 
]j 七 7 
OFi $0,$0;0 


提 提 提 提 井 井 提 井 提 间 井 间 提亲 井 井 提 井 井 间 提亲 井 间 间 井 并 提亲 间 提 并 间 间 提亲 并 间 间 间 间 间 提亲 并 井 林 间 提 提 
划 程序 执行 到 这 儿 表 示 正 确 通过 ， 
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般 井 否则 CPU 已 经 跳 转 到 失败 (fail) 标 签 处 

大 .glLob1 pass 

区 Pass : 
软 pb Common 

| OF v0,$0,0xabcd 

汉 , glob1 fail 

fail， 

才 OFi V0，$0,0xdead 

起 Common 

二 nop 

方 LOGUEEXIT 

法 . endcl Start 
3 这 个 程序 经 编译 链接 后 ,产生 一 个 可 执行 文件 ,为 了 看 清楚 这 个 可 执行 文件 的 内 部 结构 ， 


考虑 编译 链接 时 所 生成 的 符号 表 : 


有 IIocating comnon Symbols 
Common Symbol Size file 
Stack 0x2000 obj/tests/crt0.o 


Memory Configuration 
Name Origin Length Attributes 
# CefauJ]t 0x0000000000000000 0Oxf 上 于 于 王 焉 芋 芋 下 芋 丰 下 于 于 于 


Linker Script and memory map 


0x0000000080020000 RRM_TEXT_HIGH = 0x80020000 
0x0000000080060000 BSS_RDDR = 0x80060000 
.七 ext 0x0000000080020000 0x1b8 

#x《【.text) 

,七 ex 0x0000000080020000 0x70 obj/tests/crt0.o 
0x0000000080020000 _Start 
0x0000000080020018 _exXit 

,七 ex 0x0000000080020070 0x1l18 obj/tests/Jumptst.o 
0x0000000080020158 fail 
0x0000000080020150 Pass 
0x0000000080020070 Start 

x<《.Idata) 


x【《.Iodata) 
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x《, data) 雇 
xx〔〈.reginfo) 入 
.Teginfo 0x0000000080020188 0x18 obj/tests/crt0.o 让 
.reginfo 0x00000000800201a0 0x18 obj/tests/Jumptst.o 软 
0x00000000800201b8 . = RLIGN(COx4) 人 
0x0000000080060000 , = BSS_ADDR 区 
0x00000000800281b0 _gp= (RARLIGN(COx10) + 0x7ff0) 刘 
0x00000000800201b8 _fbss= . 是 
. SbsS 杠 
x#《. sbss) - 
x【《. SCOmmony) 方 
.bss 0x0000000080060000 0x2000 法 
x《〈. dynbss) 
x《.bss) 235 
x<〔《COMMON) 
COMMON 0x0000000080060000 0x2000 obj/tests/crt0.o 
0x0000000080060000 StacK 
x《,. Comm) 
x《,. Lcommy) 
0x0000000080062000 . = RLIGN(COx4) 
0x0000000080062000 _end = . 
0x0000000080062000 PROVIDE (end , . ) 


LORD obj/tests/crt0.o 
LORD obj/tests/Junmnptst.o 


OUTPUT(obj/tests/Jumptst elf32 - bigmips) 


,mcebug 0x0000000080062000 0Ox7ac 
.mdebug 0x0000000080062000 0x334 obj/tests/crt0.o 
,mdebug 0x0000000080062334 0x4b8 obj/tests/Jumptst.o 


这 个 程序 包含 了 2 个 源 文件 crt0. s 和 Jumptst, s 所 生成 的 可 执行 文件 的 映射 表 ,Crt0, s 
是 一 个 系统 文件 ,是 执行 文件 的 初始 化 起 始 文件 , 它 完成 一 个 程序 开始 运行 时 所 有 的 初始 化 工 
作 ,然后 跳 转 到 所 编写 的 源 程序 中 定义 的 人 口 , 例 如 :main() 函 数 。 从 这 个 映射 表 中 可 以 清楚 
地 看 到 : 

代码 段 (. text) 由 0x80020000 虚 地 址 开始 ,代码 的 长 度 是 0xlb8 字 节 。 

其 中 crt0.o 中 的 代码 是 0x70 字 节 。 

Jumptst. o 中 的 代码 是 0x118 字 节 。 

而 register - information 各 占 了 0xl8 字 节 。 即 : 

0xlb8 一 0x70 十 0xl118 十 0xl18 十 0x18 
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数据 段 (. data)、 只 读数 据 段 (.rdata， . rodata) 都 为 空 

. sbss 段 为 空 ,该 程序 中 没有 定义 这 种 类 型 的 段 。 
.bss 段 有 0x2000 字 节 。 它 用 于 crt0. o 中 定义 的 栈 段 长 度 。 
. mdebug 表示 debug 所 占用 的 程序 空间 。 


12.2.2 链接 器 与 命令 脚本 


以 下 着 重 讨 论 如 何 通过 链接 脚本 精确 控制 程序 的 内 部 结构 。 为 此 要 考查 链接 器 (linker)， 
在 GNU 中 ,链接 实用 程序 是 ld。 

Linker 是 一 个 功能 强大 的 实用 工具 ， 它 有 许多 参数 选项 。 链接 器 的 基本 功能 是 合并 大 量 
的 中 间 ， files) 和 归档 文件 (archive files) ,重新 定位 它们 的 数据 , 绑 定 符号 引 
用 ,最 终 形成 一 个 完整 的 可 执行 映像 。 

1。SECTIONS 命令 

链接 器 接收 命令 文件 脚本 作为 参数 ,通过 命令 文件 脚本 提供 对 链接 过 程 完全 的 、 精 确 的 控 
制 。 在 脚本 文件 中 可 以 定义 节 (SECTIONS) 来 说 明 执行 目标 程序 的 内 存 布局 。 

通过 SECTIONS 命令 来 控制 输入 节 (input sections) 放 在 输出 节 (output sections) 的 位 
置 。SECTIONS 命令 精确 控制 下 面 这 几 项 : 

国 输入 节 放 在 输出 节 的 什么 位 置 。 

盘 在 输出 文件 中 的 顺序 。 

国 源 文件 中 的 模块 (或 是 程序 段 ) 放 在 那 一 个 节 。 

在 一 个 命令 文件 中 ,至 多 有 一 个 节 命 令 , 但 在 节 中 可 以 有 任意 多 的 语句 。 节 命令 中 的 语句 
可 以 做 下 面 3 种 事情 : 

国定 义 人 口 点 。 

帮 定义 一 个 符号 的 值 。 

量 描述 一 个 命名 输出 节 中 的 布局 ,哪些 输入 节 将 放 在 其 中 以 及 它们 之 间 的 顺序 。 

如 果 不 使 用 节 命令 , 则 链接 器 将 所 有 的 同类 型 输入 节 放 在 同一 个 命名 节 中 ,其 顺序 根据 它 
们 在 输入 文件 输入 节 的 顺序 而 确定 。 

2. 链接 定位 点 

在 理解 链接 器 工作 原理 之 前 ,介绍 一 下 定位 点 (the location counter) 。 它 是 一 个 预定 义 变 
量 (“.”) ,是 链接 器 在 当前 输出 位 置 的 一 个 计数 器 。 它 只 能 出 现在 SECTIONS 命令 中 (该 命令 
在 后 面 小 节 中 将 详细 讨论 ) ,定位 点 “. 2 的 值 随 着 输出 节 中 内 容 的 增加 而 自动 增加 。“. ?可 以 
出 现在 任意 需要 表达 式 的 地 方 ,可 以 把 它 作 为 一 个 值 赋 给 一 个 符号 (symbol) 。 定 位 点 只 能 向 
前 移动 ,而 绝 不 能 往 后 移动 。 
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例如 : 依 
SECTIONS ! 公 
filel(.text) 软 

.= .+ 0x1000 件 

file2 〈.text) 论 

，= ，+ 0xl000 计 
file3〈,text) 之 

) = 0x1234 已 


在 这 个 例子 中 ,链接 器 首先 从 默认 的 起 始 位 置 开 始 输入 filel 中 的 . text 节 , 接 下 来 ,链接 -本 
定位 点 向 前 移 到 了 0x1000 个 字 节 ,继续 输出 file2 中 的 . text 节 , 之 后 ,链接 定位 点 又 向 前 移 到 也 
了 0x1000 个 字 节 ,接着 输出 file3 中 的 . text 节 。 于 是 在 输出 节 中 ,filel 的 . text 部 分 跟 file2 
的 . text 部 分 之 间 出 现 了 0x1000 字 节 的 间 了 中。 大 括号 后 面 的 “=0x1234” 给 出 了 这 些 空隙 里 的 
数据 填充 式样 。 同 理 file2 与 file3 之 间 的 空隙 也 如 此 。 

3. 节 定 义 

在 节 命 令 中 用 得 最 多 的 是 节 定 义 , 它 指定 一 个 输出 节 的 特性 :包括 它 的 位 置 , 对 齐 边界 ,内 
容 , 填 充 模式 和 目标 内 存 区 域 。 这 些 指定 都 是 可 选 的 ,最 简单 的 格式 如 图 12 -4 所 示 : 


SECTIONS { 


ee 


12-4 节 的 简单 格式 
例如 


SECTIONS 


foo.o(C.text) 


它 会 在 输出 文件 中 产生 一 个 名 为 . text 的 节 , 并 把 目标 文件 foo.o 的 代码 段 (. text) 放 到 
输出 文件 的 . text 段 中 。 
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secname 是 输出 节 的 名 字 。secname 可 以 是 任意 的 名 字 ,例如 


.foo { x*(〔〈.foo)}》 


但 是 节 的 和 名字 必须 符合 输出 目标 文件 (例如 ,a. out 或 其 他 的 ELF 文件 ) 的 格式 。 某 些 目 
标 执行 文件 只 支持 有 限 数 目的 节 , 例 如 :a. out 文件 仅 允 许 . text,. data,. bss 节 。 
contents 指定 节 中 的 内 容 , 例 如 一 个 输入 文件 的 列表 或 输入 文件 中 节 的 列表 。 如 果 con- 
tents 为 空 , 则 链接 器 不 产生 对 应 的 节 , 这 在 某 些 输入 节 可 能 存在 也 可 能 不 存在 (例如 : 源 文件 
根据 某 种 配置 包含 了 不 同 的 代码 ) 时 很 有 用 。 
指定 节 的 内 容 , 可 以 通过 列 出 节 中 所 含 的 输入 文件 ,或 是 列 出 节 中 所 含 的 输入 节 ,或 者 指 
定 二 者 的 组 合 。 在 一 个 单一 的 节 定 义 中 ,可 以 放置 任意 数目 的 内 容 条 目 ( 输 入 文件 ,或 输入 
节 ) ,它们 由 空白 字符 分 隔 。 
下 面 是 可 行 的 一 些 实际 例 子 : 
.fool :， 
obj/mips_0.o (.text) 
obj/sbdreset_0.o (.text》) 
} 


.foo2 2 
{ 
obj/entry.c(〈.text .rdata .rodata . data) 


obj/compress.o (.text) 


obj/command.o (x) / x“commancd. o" 文 件 中 的 所 有 节 *V/ 
} 
.foo3  : 
{ 

x 《. 七 ext) /x 所 有 文件 的 〈.text) 节 * / 


xx 〈《. rdata . rodata . data) 
x 〈.Teginfo) 
} 


.data : { afile.o bfile.o cfile.o}) /x* 由 空格 分 隔 */ 


其 中 * ”是 通配符 ,表示 所 有 的 文件 ,如 果 某 些 文件 在 前 面 的 节 中 引用 了 部 分 节 , 则 这 个 
节 中 包含 所 有 的 剩余 文件 。 同 样 ,如 果 一 个 文件 后 面 没有 跟 节 说 明 ( 指 定 “section”) , 则 该 节 中 
包含 这 个 文件 中 的 所 有 节 ，, 如 果 该 文件 中 的 某 些 节 被 前 面 的 节 显 示 地 包含 了 其 中 的 某 些 节 ( 例 
如 :. text), 则 该 节 中 将 包含 这 个 文件 中 的 所 有 剩余 节 。 

图 12- 5 给 出 节 完 整定 义 的 语义 : 
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SECTIONS { 


secname ”Start BLOCK (aiigm) (NOLOAD) : ATddaddm) 
{ 

Contents 

> region : phdr = fi 


图 12-S 节 的 完整 定义 
节 的 有 些 属性 是 可 选 的 ,其 中 节 的 名 字 和 内 容 是 必须 的 ,其 余 属 性 都 是 可 选 的 。 
start 强制 申明 该 节 被 装载 到 某 个 指定 的 位 置 。start 可 以 是 任意 的 表达 式 , 例 如 ， 


SECTIONS { 


output “0x80000000 : { ……》 


BLOCK(align) 它 把 链接 器 的 当前 定位 点 向 前 移 到 指定 边界 对 齐 的 位 置 ,让 节 从 新 的 
定位 点 位 置 开 始 ,而 不 一 定 跟 上 一 节 紧 连 在 一 起 。align 是 一 个 表达 式 。 

NOLOAD 禁止 一 个 节 在 执行 时 把 它 装 人 到 内 存 。 这 对 于 ROM 程序 比较 有 用 。 

AT(ldaddr) ”AT 关键 字 后 面 的 ldaddr 表达 式 指 示 这 个 节 的 装 人 地 址 (the load ad- 
dress) 。 默 认 情 况 下 , 装 人 地 址 跟 重 定位 地 址 (the relocation address) 是 一 致 的 , 即 在 没有 ATI 
(ldaddr) 属 人 性 说 明 的 时 候 。 这 个 特性 在 设计 ROM 上 映 像 时 很 有 用 。 

下 面 的 例子 中 定义 了 2 个 输出 节 :第 一 个 节 叫 “. text”, 它 开始 于 地 址 0x10000000 , 另 一 个 
节 叫 “. mdata”, 它 的 重 定位 地 址 开始 于 0x10080000 ,但 是 它 的 装 人 地 址 却 是 紧 跟 在 “. text” 之 
后 。 符 号 ”data” 的 值 被 定义 为 0x10080000。 


SECTIONS 《 
,text “0xl0000000 : ({ <*《(.text) _etext = .# 
.mcata “0x10080000 : 了 (RMDDR(.text) + SIZEOF〈.text) ) 
{ _data = .; x*〔〈.data); _edata = .， } 
.bss 0x1l00E0000 : 
{( _bstart = . ; x(.bss) x*(COMMON) ; _bend = .  } 


) 


如 果 一 个 ROM 代码 按照 这 个 方法 产生 ,那么 运行 时 库 初 始 化 代码 在 程序 运行 前 必须 做 
类 似 于 如 下 代码 片段 的 初始 化 工作 。 


Char 关 SIC =  _etesxt; 
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char xx dst = _data; 


航 
人 /* ROM 里 面 有 数据 存放 在 .text 节 的 后 面 , 复 制 它 到 执行 地 址 * / 
式 while (dst < _edata) { 
软 x dat++ = %SIrC++H; 
设 
计 /xZero bss x/ 
三 for (dst = _bstart;i dst < _bend;i dst++) 
想 xdst = 0; 
司 >>region : phdr 。 是 与 物理 内 存 相关 的 属性 ,在 此 不 再 袭 述 。 
开 =-f1 是 节 之 间 空 除数 据 的 填充 模式 。 
> 
4.ENTRY 命令 
240 ENTRY 命令 定义 程序 人 口 的 起 始点 ,其 语法 如 图 12 -6 所 示 : 


ENTRY (symbol) 


12-6 口 (ENTRY) 的 定义 
其 中 symbol 是 一 个 全 局 标号 ,例如 : _start。 如 果 没 有 Entry 定义 , 则 链接 器 将 默认 从 代 
码 段 的 起 始 位 置 作为 程序 的 执行 人 口 。 
S. 链接 命令 脚本 示例 
下 面 来 看 一 个 完整 的 命令 脚本 的 例子 , 它 用 于 产生 12. 2. 1 小 节 中 的 程序 映像 表 。 


/关头 闪闪 关 兴 关头 关 关 闪闪 关 尖 关 关 其 关 关 类 尖 尖 尖 尖 关头 关 关 关头 关 尖 关头 关 关 关 关 关 关 关 关 尖 闪闪 关 关 尖 尖 关 尖 尖 尖 关 尖 共 尖 闪闪 关 关 次 其 其/ 


/x* ERile tests.mk 关 / 
1/ 关 闪 / 
/xx Ruthor: Magellan x / 
/xx Description， 关 / 
/ 测试 程序 的 连接 脚本 # / 
/ x 关 / 


/闪闪 兴 关 关 关 尖 关 次 关 尖 兴 关 关 关 关 关 关 关 关 关头 关 关 关 关 关 关 关 关 凑 关 其 关头 尖 关 关 尖 关 关 尖 关 关 凑 关 关 尖 关 关 关 关 关 尖 关 尖 尖 关头 关 关 次 关 尖 / 
OUTPUT_FORMRT("elf32 - 1ittlemips"，"elf32 - bignmips"，"elf32 - Littlemips"”); 
OUTPEUT_RARCHCmips) ; 


ENTRY(_start) ; 

RRM_TEXT_HIGH = 0x80020000; 
BSS_RADDR = 0x80060000; 
SECTIONS 


{ 
.text RARM_TEXT _HTGH : 
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# 《.text) 
x* 〈. rdata ,rodata . data) 
x< 〈.reginfo) 
.= RMLIGN(COx4); 
) =0 
，= BSS_RAMDDR; 
/x* ~mgn~ atrick here to force ，forward x* / 
.__bsstart BSS_ADDR : {( .= RLIGNCOx4); ) = 0 
_gp = RMLIGN(C16) + 0x7ff0; 
_fbss = .; 
.Sbss : { x*(.Ssbss) x*《〈《.Scommon) }》 
.bss 
{ 
x*〈. dynbss) 
x《.bss) 
x《COMMON) 
x#《. Comm . 1Cormmy) 
》 
， = MLIGN(32 / 8); 
_end 六 人 寻 
PROVIDE (end = .); 
} 
在 Makefile 中 安排 make 执行 下 列 命令 就 可 以 生成 “12. 2. 1 能 人 式 系统 中 执行 程序 的 映 
像 ” 中 的 例子 所 产生 的 符号 映像 表 (map) 。 其 中 链接 时 所 使 用 的 命令 如 下 所 示 
$ (LD) -Ttests.mk 一 Map Jumptst.map crt0.o Junmptst.o -ooJumptst.out 
小 结 : 
本 节 通 过 实际 例子 讲解 了 如 何在 汇编 源 程 序 中 定义 节 ; 如何 通 过 在 编译 脚本 中 定义 输入 
节 以 及 输出 节 来 控制 代码 或 数据 在 目标 执行 文件 中 的 位 置 ; 并 在 上 一 节 中 通过 汇编 源 程序 与 
编译 链接 后 生成 的 目标 文件 的 映像 文件 进行 对 照 分 析 。 通 过 对 这 些 内 容 的 学 习 , 读 者 可 以 更 
加 深信 地 了 解 程序 的 内 部 结构 ,从 而 在 散 入 式 软件 设计 实践 中 增加 对 程序 的 控制 能 力 。 


12.3 ELF 文件 格式 


Ce 


12.3.1 ELF 文件 格式 概述 
ELF(Executable and Linking Format) 表 示 可 执行 和 链接 格式 。 从 名 字 上 来 着 ,ELF 文 
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件 不 仅 包含 可 执行 文件 (* . out) ,还 包括 可 用 于 链接 的 中 间 文 件 , 即 是 (* . obj ,或 *.o)，, 以 及 
可 以 动态 链接 的 文件 (* . a) 。 因 此 ELF 文件 格式 是 一 种 应 用 广泛 的 文件 格式 。 

ELEF 文件 格式 定义 了 3 种 类 型 的 目标 文件 (object file) : 

@ 可 重 定位 的 文件 (relocatable file) 。 它 包含 代码 和 数据 以 用 于 与 其 它 的 目标 文件 相 链 
接 , 从 而 建立 一 个 可 执行 的 文件 或 是 一 个 共享 的 目标 文件 。 

@ 可 执行 文件 (executabjle file) 。 它 包含 一 个 完整 的 可 以 执行 的 程序 。 这 样 的 文件 指定 
执行 文件 加 载 器 (exec) 如 何 创建 一 个 新 程序 的 进程 映像 ,并 开启 新 的 进程 的 运行 。 

图 共享 的 目标 文件 (shared object file) 。 它 包含 代码 和 数据 以 用 于 在 如 下 2 种 上 下 文 的 
链接 : 

辐 链接 器 将 它 与 其 他 可 重 定位 的 目标 文件 一 起 ,建立 另 一 个 目标 文件 。 

图 动态 链接 器 将 它 与 一 个 可 执行 文件 或 是 另 一 个 共享 的 目标 文件 结合 起 来 ,以 建立 一 个 
进程 映像 。 

需要 说 明 的 是 :上 且 标 文 件 是 编译 器 和 链接 器 创建 的 以 期 望 在 处 理 机 上 直接 运行 的 二 进 制 
表示 形式 。 它 们 可 能 是 一 些 代码 或 数据 片段 ,而 可 执行 文件 才 是 可 以 完整 运行 的 程序 映像 。 

1. 目标 文件 格式 

如 上 所 述 ,目标 文件 参与 到 程序 的 链接 和 执行 过 程 中 。 图 12- 7 显示 了 目标 文件 的 格式 ， 
为 了 方便 和 高 效 ,目标 文件 提供 了 一 个 文件 内 容 的 2 种 视图 , 即 链接 视图 和 执行 视 锅 。 


链接 视图 执行 视图 
| HEF3J 部 | 


12 -7 ELF 目标 文件 格式 
ELF 头 部 存在 于 一 个 文件 的 开始 位 置 , 它 相当 于 整个 文件 的 一 个 导航 器 ,指示 文件 后 面 
各 部 分 的 组 织 结构 和 内 容 信息 。 
程序 头 部 表格 (program header table) 是 可 选 的 , 它 表 示 在 系统 中 ,装载 器 如 何在 内 存 中 
创建 一 个 进程 映像 。 用 于 创建 进程 映像 的 可 执行 文件 必须 有 一 个 程序 头 部 表格 , 重 定 位 的 目 


标 文 件 不 需要 程序 头 部 表格 。 
节 头 部 表格 (setction header table) 包 含 了 目标 文件 节 的 信息 。 每 一 个 节 在 这 个 节 头 部 表 
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格 中 有 一 个 条 目 ,每 一 个 条 目 给 出 诸如 节 的 名 字 , 节 的 起 始 , 节 的 长 度 等 信息 。 在 链接 过 程 中 “| 报 


使 用 的 目标 文件 必须 有 一 个 节 头 部 表格 ,其 他 的 文件 不 一 定 需要 。 因 而 节 是 可 选 的 ,从 而 节 头 “| 人 


部 表格 也 可 以 不 存在 于 一 个 目标 文件 中 。 区 
2， ELF 头 部 件 
ELF 文件 头 部 包含 整个 文件 的 控制 结构 。 一 些 ELF 文件 的 头 部 可 能 随 着 版 本 的 升 高 而 | 证 

扩张 ,所 以 早期 版 本 的 程序 可 以 忽略 这 些 额 外 信息 。 区 罗 
ELF 头 部 定义 如 下 如 示 ， 总 
井 define EI_NIDENT 16 与 
typedef struct { 方 

unsigned char e_jident[EI_NIDENT ]; 了 去 
ELf32_Hal e_type; 
El1f32_Half e_machine; 243 
EIE32_Word e_Version; 
瑟 ]f32_Rddr e_entrYy; 
了 If32_Off e_phoff; 
El1f32_Offf e_shoff; 
El1f32_Word e_flags; 
El1f32_Half e_ehsize; 
开 Lf32_Half e_phentsizei; 
RE1If32_Half e_phnum; 
了 If32_Half e_Sshentsize; 
也 1f32_Half e_Sshnumy 
了 LE32_Ha]f e_Sshstrndx; 
) 了 R1Lf32_Ehdr; 


ELF 头 部 结构 中 各 变量 的 含义 如 下 : 


(1) e_idqent 


e_ident 是 16 个 字 节 的 标识 字段 , 它 表 示 该 文件 是 ELE 文件 。 其 中 : 
开始 的 第 0 一 3 字 节 是 "7F' 十 下 十 十 下 ,为 ELF 文件 标识 。 
第 4 字 节 是 EI_CLASS 字段 , 它 标 识 这 个 文件 的 类 别 :0 表示 无 效 ,1 表示 32 位 目标 ,2 表 


示 64 位 目标 。 


第 5 字 节 是 数据 字 节 顺序 :0 表示 无 效 ,1 表示 低 字 节 顺 序 ,2 表示 高 字 节 顺序 。 


第 6 字 节 表 示 ELF 头 部 的 版 本 。 
随后 的 字 节 是 填充 字 节 。 

(2) e_type 

e_type 表示 目标 文件 的 类 型 ,其 中 
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0 ”表示 无 效 ; 
1 表示 可 重 定位 的 目标 文件 ; 
2 表示 可 执行 文件 ; 
3 ”表示 共享 的 目标 文件 ; 
4 表示 核心 文件 。 

(3) e_machine 

e_machine 表示 目标 机 器 类 型 ,例如 

3 表示 Intel 80386 ; 

8 表示 MIPS R3000。 

(4) e_version 

e_version 表示 文件 的 ELF 版 本 号 。 

($) e_ entry 

e_ entry 表示 可 执行 文件 人 口 的 虚 地 址 ,如 果 这 不 是 可 执行 文件 或 是 没有 程序 人 口 , 则 该 
字段 为 0。 

(6) e_phoff,e_phentsize ,e_phnum 

e_phoff 表示 程序 头 部 表格 的 起 始 偏 移 地 址 。e_phentsize 表示 每 一 个 程序 头 部 条 目的 长 
度 ,而 ephnum 表示 程序 头 部 条 目的 数目 。 程 序 头 部 可 以 没有 ,从 而 e_phoff 可 以 等 于 0。 

《7) e_ shoff ,e_shentsize ,e_shnum 

e_phoff 表示 节 头 部 表格 的 起 始 偏 移 地 址 。e_shentsize 表示 每 一 个 节 头 部 条 目的 长 度 ， 
而 e_shnum 表示 节 头 部 条 目的 数目 。 节 头 部 可 以 没有 ,从 而 。_shoff 可 以 等 于 0。 

(8) e_flags 

e_flags 包含 一 些 标志 位 。 

(9) e_shstrndx 

e_shstrndx 指示 节 名 字 字 符 表 的 索引 编号 。 


3. 节 

在 链接 脚本 中 已 经 介绍 了 节 的 概念 。 一 个 目标 文件 的 节 头 部 表格 给 出 了 该 文件 所 有 节 的 
位 置 、, 名 字 和 长 度 等 信息 。 这 个 节 头 部 表 是 数据 结构 Elf32_shdr 的 一 个 数组 ,一 个 索引 号 当 
作 下 标 可 以 寻 址 这 个 数组 。e_shoff 给 出 了 这 个 数据 结构 数组 从 文件 开始 位 置 处 的 字 节 偏 移 ， 
e_shentsize 表示 这 个 数据 结构 的 长 度 ,e_shnum 显示 了 这 个 数组 中 有 多 少 个 这 样 的 数据 结 
构 , 即 这 个 文件 中 包含 多 少 个 节 。 

节 头 部 的 定义 如 下 : 

typedef struct ( 

了 If32_Word Sh_name; 
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RERLf32_Word Sh_type; 民 
所 

El1f32_Word Sh_f]lags; 了 
E1f32_Word -sh_addr; 起 
交 
El1f32_Off sh_offsetj 件 
E1f32_Word sh_sizei 请 
ELft32_Nord Sh_link; 计 
El1f32_Word sh_infoi 之 
本 f32_Word sh_addralign 1 思 . 
ELf32_Word sh_entsizey; 想 
ElLf32_shdr; 
人 
节 头 部 结构 中 各 变量 的 含义 如 下 法 


《1) sh name 节 名 字 

sh_name 不 是 一 个 字符 串 ,而 是 一 个 索引 , 它 指示 在 节 名 字 字 符 串 表 中 的 起 始 位 置 。 节 名 字 ”|245 
字符 串 表 中 包含 了 许多 字符 串 ,其 中 每 一 个 字符 串 都 是 用 NULL 字符 标识 结尾 。 每 一 个 节 名 字 
都 是 从 索引 所 指示 的 起 始 位 置 开 始 直 到 遇见 一 个 NULL 字符 时 它们 之 间 所 包含 的 字符 串 。 

(2) sh_type 节 类 型 

sh_type 表示 节 的 类 型 , 按 内 容 和 意义 对 节 进 行 分 类 。 例 如 :符号 表 , 字 符 串 , 重 定 位 
节 等 。 

(3) sh_flags 节 标 志 

sh_flags 表示 节 的 标志 。 

(4) sh_addr 节 内 存 地 址 

如 果 该 节 在 内 存 中 出 现 , 则 表示 该 节 作 为 一 个 进程 映像 在 内 存 中 应 该 装载 的 位 置 。 

(5S) sh_offset 节 偏 移 地 址 

指示 这 个 节 的 实际 内 容 在 文件 中 相对 于 文件 头 部 的 字 节 偏 移 位 置 。 

(6) sh_size 节 的 大 小 

指示 这 个 节 的 实际 内 容 在 文件 中 所 占 空间 的 大 小 , 即 节 的 长 度 。 

(7) sh_jink 节 的 链接 

该 字段 包含 节 头 部 表格 中 索引 的 链接 。 其 含义 依赖 于 节 的 类 型 。 

《8) sh_info 节 的 信息 

该 字段 包含 关于 节 的 一 些 额 外 信息 。 其 含义 依赖 于 节 的 类 型 。 

(9) sh_addralign 节 的 地 址 对 齐 属 性 

一 些 节 有 地 址 对 齐 的 约束 。 例 如 ,假如 一 个 节 保 存 着 双 字 ,系统 就 必须 确定 整个 节 是 否 双 
字 对 齐 。 因 此 sh_addr 的 值 以 sh_addralign 的 值 作为 模 , 其 结果 一 定 为 0, 否则 文件 信息 错误 。 
目前 ,仅仅 0 和 正 的 2 的 次 方 是 允许 的 。 值 0 和 1 意味 着 该 节 没 有 对 齐 要 求 。 
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(10) sh_entsize 节 的 条 目 长 度 

有 一 些 节 包含 固定 长 度 的 一 些 条 目 内 容 , 例 如 一 个 符号 表 。 对 于 这 样 的 节 ,sh_entsize 给 
出 这 些 条 目 内 容 的 长 度 。 

4. 字符 串 表 

字符 串 表 保存 着 以 NULL 结尾 的 一 系列 字符 ,一 般 称 为 字符 串 。 作 为 特例 , 节 名 字 字 符 
串 表 也 是 一 个 字符 串 表 ,一 个 ELEF 文件 中 可 以 包含 多 个 字符 串 表 。 且 标 文 件 使 用 这 些 字符 串 
来 描绘 符号 或 节 的 名 字 。 一 个 字符 串 的 引用 是 对 一 个 字符 串 表 的 所 在 节 的 索引 。 字 符 串 表 所 
在 节 的 第 一 个 字 节 的 索引 0, 每 一 个 字符 串 节 的 第 一 个 字符 是 NULL 字符 ,从 而 字符 串 索引 0 
是 一 个 空 昧 。 同 样 的 ,一 个 字符 串 节 的 最 后 一 个 字 节 也 保存 着 一 个 NULL 字符 ,以 确保 所 有 
的 字符 串 都 以 NULL 终止 。 由 此 索引 0 的 字符 串 表 示 是 NULL, 其 他 索引 表示 的 字符 串 则 是 
从 索引 所 指示 的 位 置 开 始 , 直 到 遇 到 一 个 NULL 字符 之 间 的 字符 串 。 一 个 空 的 符号 表 节 是 允 
许 的 ; 它 的 节 头 部 的 成 员 sh_size 将 为 0。 对 空 的 string table 来 说 , 非 0 的 索引 是 没有 意义 的 。 

表 12-1 列 出 了 一 个 有 25 字 节 的 字符 串 表 (这 些 字符 串 和 不 同 的 索引 相关 联 ) ， 

表 12 -1 字符 串 表 简 单 例子 


Index +0 + 工 +2 +3 二 4 二 5 +6 十 了 十 8 +9. 
0 NO 了 己 全 e NO V 己 工 
10 过 已 b 】 e NO 己 b 1 所 
20 \0 \0 x 区 NO 


字符 串 索 引 所 得 到 的 相应 字符 串 如 表 12 - 2 例子 所 列 ， 
表 12 -2 对 字符 串 表 索 引 所 得 到 的 字符 串 


Index String 


0 NONE 

1 "name.” 

7 "Variable 
11 "able"” 

16 "able 

24 NULL string 


由 上 面 例子 可 以 看 出 ,涉及 到 对 一 个 字符 串 节 的 任意 字 节 的 引用 (索引 ), 不 一 定 是 紧 接 于 
NULL 字符 后 的 第 一 个 字符 。 一 个 字符 串 可 能 不 止 一 次 被 引用 ;引用 字符 串 的 情况 是 可 能 
的 ;同样 ,不 被 引用 的 字符 串 也 是 允许 的 。 

S$. 符号 表 

目标 文件 的 符号 表 保存 着 一 个 程序 的 符号 定义 以 及 符号 引用 所 需要 的 定位 和 重 定位 所 需 
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要 的 信息 。 一 个 符号 表 是 定 长 数据 结构 的 数组 ,因而 可 以 通过 下 标 对 符号 表 进 行 索引 。 索 引 | 媒 


0 表示 对 该 表 的 第 一 个 元 素 条 目的 索引 ,也 表示 是 一 个 未 定义 的 符号 ,也 就 是 说 ,数组 中 第 一 人 
个 元 素 定义 了 一 个 “未 定义 的 符号 ”。 和 
符号 表 条 目的 数组 结构 定义 如 下 件 

革 Ypedef struct { 设 

了 ELE32_Nord St_name:; 

El1f32_Rcdr sh_value; 有 起 

ElLf32_NWord sh_size; 看 

Unsigned char Sh_info; -二 

Unsigned char Sh_other; 廊 

El1f32_Half sh_shnadx; 这 

) ElLf32_Symi; 
247 


符号 表 条 目的 数组 结构 中 各 变量 之 含义 如 下 : 

(1) st_name 

这 个 字段 包含 了 一 个 索引 号 , 它 通过 索引 目标 文件 的 符号 字符 串 表 (symbol string table) 
来 获得 一 个 字符 串 , 用 以 表示 这 个 符号 的 名 字 。 

(2) St_value 

这 个 字段 给 出 相应 符号 的 值 。 符 号 值 依赖 于 上 下 文 , 例 如 :这 个 值 可 以 是 一 个 绝对 的 值 ， 
或 是 一 个 地 址 等 。 

(3) st_size 

许多 符号 和 大 小 相关 。 例 如 ,一 个 数据 对 象 的 大 小 是 该 对 象 所 包含 的 字 节 数 。 如 果 一 个 
符号 的 大 小 未 知 或 没有 大 小 ,该 字段 为 0。 

(4) st_info 

这 个 字段 指定 一 个 符号 的 类 型 以 及 结合 属性 。 其 中 低 4 位 是 符号 的 类 型 ,高 4 位 是 符号 
的 结合 类 型 。 

(S$) st_other 

保留 。 

(6) st_shndx 

每 一 个 符号 表 的 条 目 都 定义 为 和 某 个 节 相 关 ; 该 字段 保存 了 相关 的 节 头 部 表格 的 索引 。 

6. 程序 头 部 

目标 文件 的 程序 头 部 (program header) 是 一 个 结构 数据 , 它 描述 了 所 有 被 装载 到 内 存 的 
程序 段 。 程 序 段 的 内 容 存 放 在 目标 文件 中 ,程序 段 的 位 置 . 大 小 ,装载 到 内 存 的 位 置 等 信息 , 则 
由 程序 头 部 条 目 来 描述 。 对 于 每 一 个 程序 段 ,都 有 一 个 程序 头 部 条 目 来 描述 ,程序 所 有 这 些 描 
述 信息 集中 存放 在 程序 头 部 表 当 中 。 
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程序 头 部 条 目的 数组 结构 定义 如 下 : 

typedef struct { 
E1Lf32_Word P_type; 
RER1Lf32_Oftf P_offset; 
RLE32_RAddr P_vaddr; 
RE1Lf32_Rhddr P_paddr; 
ELf32_Word ”D_filesz; 
ELt32_Word P_memSzy 
了 ELE32_Word， P_fJlags; 
ELf32_Word P_aligns 

)》 BlLf32_Phdr， 

其 中 ， 


p_type “指示 这 个 程序 段 的 类 型 。 是 否 被 装载 或 是 否 动态 链接 等 。 

p_offset ”指示 程序 段 的 内 容 从 文件 头 部 的 字 节 偏 移 位置 。 

p_vaddr ”指示 这 个 程序 段 在 内 存 中 装载 的 起 始 字 节 的 虚拟 地 址 。 

p_paddr ”在 一 些 系统 中 ,内 存 是 与 物理 地 址 相关 的 , 则 该 字段 保留 用 来 指示 物理 地 址 。 

p_filesz “指示 这 个 程序 段 在 内 存 映像 中 的 大 小 。 它 可 以 是 0。 

pP_flags 指示 一 些 属 性 标志 。 

P_align 指示 对 齐 属 性 。 

7. 基地 址 

可 执行 和 共享 的 目标 文件 都 有 一 个 基地 址 ,该 基地 址 是 与 程序 的 目标 文件 在 内 存 映 像 中 
的 最 低 虚 拟 地 址 。 基 地 址 的 用 途 之 一 是 在 动态 链接 过 程 中 重 定位 该 程序 的 内 存 映像 。 一 个 可 
执行 目标 文件 或 一 个 共享 的 目标 文件 的 基地 址 是 在 执行 的 时 候 通过 3 个 值 计 算 而 来 的 ,它们 
是 内 存 装 和 人 地址 ` 页 面 大 小 的 最 大 值 和 程序 的 可 装 人 段 的 最 低 虚 拟 地 址 。 

8. 程序 的 装 入 

当 系 统 创 建 一 个 进程 映像 的 时 候 , 从 逻辑 上 说 系统 将 复制 一 个 文件 的 程序 段 到 内 存 虚拟 
地 址 空间 。 系 统 什 么 时 候 实 际 地 读 文 件 ,依赖 于 程序 的 执行 行为 和 系统 载 人 等 。 一 个 进程 仅 
仅 在 执行 时 需要 引用 逻辑 页 面 时 才 为 一 个 程序 段 分 配 一 个 实质 物理 页 面 , 因 为 进程 在 很 多 时 
候 通常 并 不 访问 很 多 的 逻辑 页 面 。 物 理 上 的 延迟 读 可 以 很 好 地 改善 系统 的 性 能 ,而 且 可 以 节 
省 物理 内 存 空 间 ,这 就 是 系统 的 页 面 管理 。 当 一 个 进程 被 启动 时 ,系统 将 控制 转 人 到 由 ELF 
头 部 所 定义 的 e_entry 所 指示 的 虚 地 址 开始 执行 。 


12.3.2 ELEF 文件 格式 分 析 器 加 
很 多 Linux 可 执行 文件 采用 ELF 文件 格式 或 它 的 变种 ,ELF 文件 格式 是 理解 和 实现 装 
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载 器 的 基础 。 通 过 分 析 ELF 文件 格式 ,可 以 帮助 读者 深入 了 解 一 个 程序 的 内 部 结构 ,对 于 动 ”| 刀 

态 库 的 连接 机 制 , 对 程序 的 运行 机 制 的 理解 都 会 起 到 有 益 的 帮助 。 

下 面 通过 一 个 ELF 文件 格式 分 析 器 实例 来 加 深 对 ELF 文件 格 趟 的 理解 ,在 代码 实例 中 软 

穿插 了 一 些 说明 注 释 , 以 便 读 者 更 容易 对 照 件 

W 关 兴 闪闪 关 并 闪 关 兴 尖 关 关 关 闪 关 尖 关 关 尖 半 关头 闪闪 其 其 关 尖 并 关 六 关 尖 尖 并 关 关 关 闪闪 其 关 闪闪 其 关 关 关头 关 关 凑 基 关 尖 共 关 关 关 闪 关 其 关 关 设 

关 FEile: elfpars,c 一 分 析 了 IE 文 件 的 一 个 工具 和 

尖 3 

x#* ， Copyright《〈c) 2006 棚 

关 R1L1 rights reserved. -与 

共 闪 关 放 闪闪 并 闪 疾 闪闪 关头 关 凑 闪闪 其 头头 谋 疼 关 其 关头 六 关 基 关头 并 凑 凑 放 其 旋 尖 头疼 深 闪 凑 凑 疾 共 疾 关 次 关 关 闪闪 关 凑 凑 尖 次 关 关 并 关 关 次 万 

DESCRIPTION ， 法 
Modification history 

249 


2006/04/26 -MGN initial created. 

兴 兴 关 兴 关 其 兴 关 兴 兴 关 尖 闪闪 关 关 闪闪 次 兴 尖 尖 尖 尖 尖 兴 类 关 闪 兴 兴 其 凑 闪闪 关 尖 关 关 关 凑 尖 尖 其 关 关 凑 尖 其 关 关头 关 关 其 尖 关 关 关 尖 产 关 其 关 / 
# include "stdio.h" 

# include "stdliib,h" 

划 include "string. h" 


柯 include "elf.h" 
井 include "elfpars.h" 


// 处 理 机 以 及 内 存 有 字 节 顺序 的 问题 ,例如 :x86 体系 属于 低 字 节 顺 序 。 
井 ifdef BGEN 

井 define BG_ENDIRN 

井 undef LT_ENDIRN 

井 else 

井 define LT_ENDIRN 

井 undef  BG_ENDIRN 

井 endif 


/* 对 于 多 于 一 个 字 节 的 数据 单元 , 低 字 节 顺 序 与 高 字 节 顺序 刚好 相反 ,这 影响 数据 单元 在 寄存 器 中 的 
存放 顺序 以 及 在 磁盘 文件 和 内 存 中 的 存放 顺序 ,如果 它们 的 顺序 不 兼容 ,必须 做 转换 , 下面 的 宏 就 是 这 种 转 
换 的 一 个 例子 。 

井 define ET_ENDIRN 

// 井 define BG_ENDIMN 

关 / 

# ifdef LT_ENDIRMN 

#define _swap2(x) (x) 

- 井 define _swap4(x) 《xX) 
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报 井 else 

大 : /xBG_ENDIRNx / 

式 提 define _swap2(xz)  〈(((z) 之 之 8)S&0xff)|(((x)S&0xff)<<<<8)) 

软 井 define _swap4(x) 玲 

休 ((((x)S&Oxff)<<<24)|(((x)&0xff00)<<<8)|1(((xz) 之 >8)S&0xff00)|(((x) 之 之 24)&0xff)) 

计 井 endif /xDLT_ENDIRN x / 

2 // 提 define MKHARLE(a,b) ((((a)&0xff)<<<8)|((b)&0xff)) 

起 // 厅 define MEWORD(a,bc,d)  (〈((((a)&0xftf)<<<24)|(((b)&0xff)<<<16)|(((c)S&Oxftf)<<8)1 
外 | (CDsoxtf) 

- 洒 间 define MKHRLF(a,b) (((a)&0xff)|(((b)&0xff)<<8)) 

刀 井 define MKNWORD(a,bycyd) (((a)&Oxff)|(((b)&0xff)< 一 一 8)|(((c)&0xEt)<<16)|(((d)&Oxtf) 一 一 24)) 


static int swap_ehdr (El1f32_Ehdr x* ehdr)y 

static int swap_shdr (E1f32_Shdr x shdr)y 

static int swap_symentry (El1f32_Symx Sym) ; 

static int disp_sec_entry (El1f32_Shdr * shdr,char x* strtbl, int idx); 
static :int disp_sym_entrYy (El1f32_Sym x SYm,Char * Strtbl, int btitle); 
Static int disp_phdrtb1l (Elf32_Phdr x* pphdr, int numy int esize); 


了 LIf32_Ehdr ehdr; /x* elft file hdr x / 

R1Lf32_Shdr x* pshdr; /x Section hdr array x / 
ElLf32_Phdr * pphdr; / x program hadr array x / 
ElLf32_Shdr shdr; / * Section hdr x / 

char # SnStrtbl1; / * section_nanme 的 字符 串 表 * / 
char 类 Strtbly /* 目标 文件 的 字符 串 表 * / 
char x Symtbl; /xx 目标 文件 的 符号 表 x* / 


int main(int argc,Char xx argv) 
{ 
FILE xin; 
char fnin[256],buff[512]，x p; 


int inyres，x pD32,bend,oftf,sizej 


Snstrtbl = 0; Strtbl1 = 0; 
SyYmtbl1 = 0; Tes = 一 1; 
pphdr = 0; pshdr = 0; 
if(argc<<2)1{ 


printf 人 "Please select a target fileNn" ,argv[L0]); 
printf("usage: $%Ss a.out\n" ,argv[0]); 


Teturn res; 
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} 


Zr 
六 


strcpy(fninyargv[1]); 人 
/ x Open the target file x/ 
fin = fopen(fnin，rb"); 件 
if(fin == 0){ 设 
Printf("in_f o_errNn") ; goto exit_mi;》 计 
/* 读 ELE 文件 头 部 ,ELE 文件 头 部 应 该 是 16 个 字 节 的 标识 字段, 它 表示 该 文件 是 ELF 文件 。 其 中 :开始 | 伍 
的 第 0 一 3 字 节 是 "7E + 下 + + 下。x/ 相 
if((n = fread(&ehdr,1,sizeof(E1f32_Bhdr),Ffin)》! = sizeof(EBLf32_Ehdr)) 《 
printft("error read ELEF file header,Nn"); 方 
goto ”ezxit_i; 计 
》 

printf("\nParse the ELF file headerNn"); 251 

swap_ehdr(&ehdr); / #x Swap it to right byte order x / 


/ x pase the ELF header，， xx / 
p32 = (intx )ehdr.e_ident; 
证 (xp32 ! = (MKWORD(Ox7E ED yyE 7))》 AAATE + 十 工 十 下 
| 
printf("Input file is not ELF file (Error Magic code: 多 c. %c.%c. 区 c).Nn"， 
ehdr, e_ident[0j,ehdr.e_ident[1],ehdr.e_ident[2],ehdr.e_ident[3]); 
goto exit_i; 


} 


/ x get.the file type; reloc,executable,dynamic.. 《目标 文 件 各 种 类 型 ) 
x< iachine type: MIPS ,ARMN, . 
关 / 
disp_ihalf_desc (e_type_descRehdr.e_typeye_type_str); 
disp_ihalft_desc〈e_machine_descR,ehdr.e_machiney,e_machine_str); 


Brintf(” entry_point: 0xg% 08x \n",ehdr.e_entry) ; 
〈 注 :可 执行 目标 文件 才 有 程序 头 部 ,可 链接 的 目标 文件 不 一 定 有 程序 头 部 , 即 :程序 头 部 
是 可 选 的 ,如 果 一 个 目标 文件 没有 程序 头 部 , 则 p_hdr_ off 等 于 0,p_hdr_num 也 等 于 0。) 


/x Brogram header (程序 头 部 :起 始 位 置 , 条 目 长 度 , 条 目 数 目 ) * / 
printf("\n program header info，\n"); 


Printf(" P_hdr_off ， 0xg%g08x (%d)\n" ， ehdr.e_phoff,ehdr.e_phoff); 
Printf(” P_hdr_num 向 dm" ， ehdr,e_phnum); 
printf(" P_hdr_entsize，g%d (total: % d)N\n",ehdr.e_phentsize， 


ehdr. e_phnum x* ehdr. e_phentsize) ; 
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( 注 : 同 样 地 ,一 个 目标 文件 是 否 有 节 也 是 可 选 的 ,用 于 连接 的 目标 必须 有 节 。 链 接 器 


拒 
入 | (Linker) 把 所 有 中 间 目 标 文件 的 节 ,或 者 按照 脚本 文件 的 精确 定义 ,或 者 按照 贤 认 的 组 织 顺序 
孩 | 《同名 的 世 接 链 楼 器 处 理 的 先后 顺序 ) 依 次 放 在 一 起 ,并 解析 各 个 节 ( 代 码 ) 内 容 中 的 符号 引 用 
件 (例如 函数 调用 ,或 数据 引用 ) 的 地 址 ,将 符号 替换 成 实际 的 调用 地 址 (数值 ) 。 对 于 可 用 于 加 载 
设 | 的 可 执行 目标 文件 ,或 是 动态 库 文 件 , 节 不 是 必须 的 。 如 果 一 个 目标 文件 没有 节 , 节 头 部 也 就 
， 可 以 不 存在 ,这 种 情况 下 ,e_shoff 等 于 0)。 
好 /* section header 〈 节 头 部 :起 始 位 置 ,条 目 长 度 , 条 目 数目 ) * / 
时 printf("\n section header info，N\n"); 
- 刁 printf(" s_hdr_off， 0x% 08x(% d)\n"， ehdr.e_shoff,ehdr.e_shoff); 
2 Printt(” S_hdr_num， 第 dd Nn" ， ehdr.e_shnum) ; 
PrIntfE(” sS_hdr_entsize，%d (total， 5 d)Nn" yehdr,e_shentsize， 

ehdr. e_shnum x* ehdr.e_shentsize) ; 
252 Printf(” String section idx = %dNn",ehdr.e_shstrndx); 


/x* read all sections《〈 读 目标 文件 中 所 有 的 节 ) 


基 if there is no Section header in the file,<<e_shofft = 0>. 
# / 

if(ehdr,. e_shoff && ehdr. e_shnumy) 

人 


(〈 注 :每 一 个 节 都 有 一 个 名 字 , 节 名 字 所 包含 的 字符 串 存在 于 一 个 专门 的 节 中 。 这 个 节 的 
索引 是 在 ELF 文件 头 部 定义 的 ,字段 e_shstrndx 是 节 表 的 一 个 索引 号 。 现 在 先 把 这 个 节 的 
内 容 读 出 来 。 这 个 节 的 描述 是 在 节 头 部 第 “e_shstrndx? 个 节 , 于 是 在 文件 中 从 文件 起 始 的 偏 
移 地 址 是 :off 一 ehdr. e_shoff 十 ehdr. e_shstrndx * ehdr. e_shentsize。) 


/ x irst get the String Sections header 
% /7 

if (ehdr.e_shstrndx == SHN_UNDEF | | / * no String table here，* / 
ehdr.e_shstrndx > = ehdr.e_shnunm ) 
goto ”no_str_tbl; 

off = ehdr.e_shofft + ehdr,e_shstrndx x* ehdr.e_shentsizes 

fseek(finyoff ,SEEK_ SET) ;. 

if((n = ， fread(&shdr,1,sizeof(ERLf32_Shdr) ,fin)) !1 = sizeof(Eif32_Shar)) 《 
printf("error read STRING section header.Nn"); 
goto exit_1i; 

》 

Swap_shdr(&shdr) ; 


第 12 章 ”理解 程序 的 内 部 结构 


/ x* Pow get the string table (the contents) x / 媒 
snstrtbl = (char x* ) malloc (shdr. sh_size); 入 
证 (! snstrtb1) 直 

goto exit_i; 软 
fseek(fin,shdr. sh_ offset ,SEEK_ SET) ; 人 
if((n = fread(sSnstrtb1,1,shdr, sh_size,fin)) 1 = shdr,sh_size) { 计 

printf("error read STRING table.\n"); 区 

goto ”exit_iy 有 起 
) 想 
/* 节 名 字 字 符 串 表 * / 方 
printf(" the content of the sec_name String table is:"); 法 
bend = 0; 


for (nD=0; nD<<shdr. sh_sizey n++ ){ 
计 (1 (ng&0Oxlf)) bend = 1; 


if(bend 8&& (snstrtblLn] == 入 0)7){ 


printf("\n ”7 
bend = 0; 
】} 


Butchar(snstrtbl[n]); 


} 
printt("\n"); 


( 注 : 现 在 读 所 有 的 节 ，, 对 于 每 一 个 节 , 节 的 信息 存放 在 节 头 部 的 一 个 描述 字段 中 。 如 上 所 
述 , 其 中 一 个 字 是 节 名 字 字 符 串 ,上 面 已 经 预先 读 出 。) 


/ * now read all section headers,and print them( 读 所 有 的 节 头 部 ) * / 
for (II=1; 1i<<ehdr.e_shnum; i++ ){ 
offt = ehdr.e_shofft + 1 xx ehdr.e_shentsizes 
fseek(finy,off,SEEK_SET) ; 


if((n = fread(&shdr,1l,sizeof(E1f32_Shdr) ,fin))!1 = sizeof(E1f32_Shdr)) ! 
printf("error read STRING section header, \n")3 
goto exit_i; 
} 
Swap_shdr(&shdr); 
disp_sec_entry(〈&shdr ,snstrtbl,i)3 
if((shdr. sh_type == SHT_STRTRB) && (i 1 = ehdr.e_shstrndx)) 
{ 
if(!1 strtbl){ // currentlLy i support only one string_table 
Strtbl = (char x* ) malloc (shdr. sh_size); 
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概 if(! strtbl) 

入 goto ”exit_ is 

起 fseek(fin,shdr. sh_offset,SEEK_SET) ; 

软 if((n = fread(strtbl,1,shdr. sh_sizeyfin))1! = shdr,sh_size){ 
件 printf("error read STRING table.Nn" ); 

设 goto ”exit_is 

华 Printf(” 一- 一 -~-- 一 -一 Nn"); 

廊 Printf("” the content of the string table is:"); 
号 bend = 0; 

方 for (nn= 0; n<Cshdr,.sh_sizey n++ ){ 

法 if(1Cn&0Oxlf)) bend = 1; 


if(bend && (strtbl[a] == 和 05){ 
printf("\n 二 
bend = 0; 
} 
putchar(strtbl[n])， 
} 
printf("\n"); 
} . 
)}//[/end of 所 证 (shdr.e_shtype == SHT_STRTRB. . ， 盖 
} 


no_str_tb]， 


类 if there js no Section header in the file,<<e_shoff = 0>. 
x 7 
printft( "\n ~-~~----------------------------------- 一 -一 -一 -~ 一 "”); 
Printf("\n Read the SymTable contents 。 \n"); 
printft( "\n  --------------------------------- 一 一 -------- 一 -一 ”); 
if(ehdr.e_shoff &g& ehor.e_shnum) 
《 
int off,btitle; /x* btitle， aflag if print Some title x / 
/# 首先 查看 有 没有 一 个 符号 表 (symtable) ， 
兴 / 
ftor (= 1; 工 < 反 ehdr. e_shnum; 宇 + 二 )《 
| Off = ehdr.e_shoff + 工 x* ehdr.e_shentsize; 
fseek(fin,off,SEEK_SET) ; 
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if((n = fread(&shdr,1,sizeof(E]1f32_Shdr) ,fin)) 1= sizeof(E1f32_Shdr)) 嵌 
printf("error read STRING section header, Nn"); 下 
goto ” exit_i; 软 

》 件 

主 〈((shdr. sh_type == _swap4(SHT_SYMTRB)) | | 到 
(shdr. sh_type == _Swap4(SHT_DYNSYM) ) ) 这 

必 

{ 思 
Swap_shdr(&shdr); 想 
disp_sec_entry (&shdr ,snstrtb1,I); 8 丝 
if (shdr. sh_size){ 六 

El1f32_Sym x ”psymy 法 
/* 现在 获 到 字符 串 表 * / 
SYmtbl = (char x* ) malloc (shdr. sh_size); 255 


if(!1 symtbl) goto exit_ii 

fseek(finy,shdr, sh_offset ,SEEK_SET) 

if((n = fread(symtbl,1,shdr. sh_sizey,fin)) ! = shdr.sh_size) { 
printf("error read SYMBOL table.\n"); 
goto ”exit_i; 

} 

off = 0; 

btitle = 1; 

while (off < shdr. sh_size){ 
psym = (El1if32_Symx )(sSymtbl + off); 
Swap_Symentry (PSym) ; 
disp_sym_entry (psym, strtbl,btitle); 
off += Shadr. sh_entsizes 
btitle = 0 

} 

printf("N\n"); 

free〈SYmtb1); 

Symtbl = 0; 


} 
( 注 : 如 上 所 述 ,程序 头 部 不 一 定 有 ， 如 果 没 有 e_phoff 等 于 0。) 
/* 读 程 序 头 部 
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xx ” 让 上 there is no program header in the file,<e_phoff = 0>. 
x% / 
证 (!ehdr.e_phoff | | !ehdr.e_phnum) { 
printE(" This object file contains no Program headerNn”" ); 


goto “phdr_end_parse_end; 


Size “= ehdr.e_phnum * ehdr,e_phentsize; 
pphdr = (El1f32_Phdr x* ) mal1oc (Size) 
(1!1pphdr) goto exit_is 


fseek(finy,ehdr. e_phoff ,SEEK_SET); 
if((n = fread((char x* )pphdr,1,sizeyfin)) 1= Size) { 
Printf("error read Prog_Hdr_Table.Nn"); 


goto exit_is 


/x ”由 于 phdr 的 所 有 字段 都 是 32 位 的 ,所 以 可 以 采用 一 个 循环 
* ”来 调整 它们 的 字 节 顺序 。 


pB32 = (intx ) pphdr; 
Rn = Size 盖 盖 2; 
While (mn 盖 0) 
{ 
< p32 = _Swap4( :+ Dp32) 3 
# p32++ 了 卫 一 ; 
} 
disp_phdrtbl(pphdr ,ehdr. e_phnum,ehdr. e_phentsize) ; 


phdr_end_parse_end, 
res = 0; 

exit_Ii, 
if(snstrtbl) free(snstrtb1); 
it(strtb1l) free(strtb1); 
iE(sYymtb1) free(symtb1) ; 
if(Pphdr) free (pphdr) 
if(pshdr) free (pshdr) 
fclose(fin); 

exit_nmy， 
Teturn reSi; 


} 


〈 注 : 主 程序 结束 ,以 下 是 一 些 数 据 字 节 交换 以 及 显示 的 一 些 例 程 。) 
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ELF 文件 头 部 的 交换 : 


static int  Swap_ehdr (El1f32_Ehdr x* ehdr) 
{ 


_Swap2((ehdr - >>e_type 7); 
_Swap2((ehdr - >>e_machine  ))* 
_Swap4((ehdr - 盖 e_version  )); 
_Swap4((ehdr - >e_entryY 7) 
_Swap4((ehdr - 盖 e_phoff )7; 
_Swap4((ehdr - 盖 e_shoff )); 
_Swap4((ehdr - >>e_flags 7))3; 
_Swap2((ehdr - >e_ehsize 7)， 
_Sswap2((ehdr - >>e_phentsize)); 

_Swap2((ehdr - 之 e_phnum 7)3 
_Swap2((ehdr - >>e_shentsize)); 

_Swap2((ehdr - >e_shnum )); 
_SwWap2((ehdr - >e_shstrndx )); 


ehdr - 盖 e_type 


ehdr - 盖 e_machine 


ehdr ~- 盖 e_version 
ehdr - 盖 e_entrYy 
ehdr - 盖 e_phoff 
ehdr - 之 e_Sshoff 
ehdr - >>e_flags 
ehdr - 盖 e_ehsize 
ehdr - 盖 e_phentsize 
ehdr - 盖 e_phnum 
ehdr - 盖 e_shentsize 
ehdr - 盖 e_Sshnum 
ehdr - >e_shstrndx 


return 0; 


全 


} 
节 头 部 的 字 节 顺 序 的 交换 (如 果 机 器 的 字 节 顺序 不 一 致 的 话 ) : 


static int swap_shdr (Elf32_Shdr x* shdr) 
《 
/ 由 于 Shdr 的 所 有 字段 都 是 32 位 的 ,所 以 可 以 采用 一 个 循环 
X 来 调整 它们 的 字 节 顺 序 。 它 有 10 个 字段 。 
关 / 
int i,x*p=(intx )Shdr,val; 
for (i=0; i<<10; 夺 ++ ){ 


Val = #P; 

xDp++ = _Swap4(Cval); 
》 
return 0; 


} 


/xx 

typedef struct { 
了 1f32_Word Sh_names; 
也 1f32_Word Sh_type; 
ElLf32_Word sh_flags; 
ELf32_Rddr sh_addr; 
了 1E32_Off sh_offset; 
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El1f32_NWord 
了 1f32_Word 
El1f32_Word 
ELf32_Word 
ElLf32_Word 
) ElLf32_Shadr; 


节 信 息 的 显示 


Sh_sizej 
sh_link; 
sh_info; 
sh_addralLign; 


Sh_entsizey; 


static :int disp_sec_entIy (El1f32_Shdr * shdr,char x* Strtbl, int idx) 


人 


Char x Pi; 


/ # get the name 类/ 


ifE《〈strtb1l){ 


P = (strtbl + shdr - 盖 Sh_name) ; 
printf("\n sec〔〈 多 d_name:[% sj]\n" idx,p); 


)else 


printft("\n sec_ (多 d_name;， unknown < poff = 0xgx>N\n" idx， 


Shdr - >Sh_namey) ; 


/ x* Sec_type: SHT_SYMTRB ,SHT_PROGBITS ,. ，x / 
disp_jiword desc (sec_type_decR,shdr - 盖 sh typey” Sec_type: 


1/ x Sec_flags: writeyalloc,instr x / 


disp_iword_desc (sec. flags_descR,shdr - 盖 sh_flags，" Sec_flags 


Printf(” 


mem_jimg_adcdr: 0xg% 08x" ,shdr- 盖 sh_addr); 


if(1shdr - sh_addr) printf(”(sec not reside in memory)")3 
printf("N\n"); 


PrintE(” 
PrintE(” 


printf(” 


sec_offset， 0xg$ 08xNn" ,shdr - 盖 sSh_offset); 
Sec_size， 0x 多 08xNn" ,shdr - 盖 sh_size); 
addr_align: $% d" ,shdr - 之 sh_addralign); 


if(!(shdr -- 盖 Sh_addralign & 一 0x1)) 
Brintf(”(sec no need alLignment)"); 
Brintf("Nn") 


printE(” 


ent_size: 种 d" ,shdr - >Sh_entsize) 


if(1(shdr - >Sh_entsize)) 
printf(”(sec not a fixed- Size entry table)"”); 
Printf("N\n") 


return 0; 
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tyYpedef struct elf32_phdr{ 六 
El1f32_Word 了 BP_tyYypes; 下 
Elf32_Off pp_offset; 软 
ELf32_RAddr P_vaddr; 1 
Elf32_hddr 。 P_paddr; 计 
Elf32_Word pP_filesz; 
E1f32_Word P_memszy; 下 
Elf32_Word P_flags; 村 
ELf32_NWord P_align; 局 

} ELf32_Phdr; 方 

法 

程序 头 部 信息 的 显示 : 沈 

static int disp_phdrtb1l (El1f32_Phdr * pphdr,int num, int esize) 

; 

int idx = 0，,1ii; 

人 mn ); 

printf("” PHDR _TYPE OFFSET VIR_ RDDR ”PHY _RDDR FILESZ MEMSZ FLRAGS 
RLIGN  \n"); 

下 DER Nn "7 


for(idx = 0; idx < num; icbx++ ) 
{ 
//disp_iword_desc(prg_type_decR,pphdrf idx].pP_type，" ”5 
for (1i= 0; prg_type_decR[ ij].pdesc != 0; i++){ 
if(prg_type_decalL ij. idx == pphdr[Lidx].P_type){ 
Printf(” (〈$d) % s" ,pphdr[ idx].pP_type,prg_type_deca[i], pdesc); 
goto ”next_phdrtbl1; 


}》 

printf(” 〈 和 多 d) 点 s" ,idxz， UN_ PTP"); 
Dext_phdrtbl : 

printf(”0xg$ 08x" ,pphdr[ idxj]j.p_offset); 

Printf(”0xg% 08x" ,pphdr[L idx].p_vaddr) 

printf(”0xg% 08x" ,pphdr[ idx].p_paddr); 

Printf(”0x 多 08x" ,pphdr[ idx].p_filesz); 

printf(”0xg% 08x"” ,ppPhdr[ idxj].p_memsz) ; 

Printf(”0x% 08x" ,pphdr[ idx].p_flags) 

printf(”0xgr 08x" ,pphdr[ idx].p_align) 
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Printf("N\n" ); 


} 


return 0; 


符号 表 : 


1/ 关 

tyYpedef struct elf32_sym{ 
ELE32_Word St_name; 
ElLf32_Rddr st_value; 
了 1f32_Word St_Ssizes 
unsigned chat St_infoi; 
unsigned char St_other; 
BE1Lf32_Half st_shndx; 

}》E1f32_Sym; 

关 / 

Static :int  Swap_symentry (El1f32_Symx* SYm) 

{ 


Sym ~- 盖 sSt_name = _sSwap4(s 四 - St_name); 
sym- >st_value = _Swap4(sSym 一 盖 St_value); 
SY - St_size = _Swap4(sSYm- >sSt_size); 
Sym- St_Sshndx = _Swap2(sym - 之 St_shndzx); 
return 0 


} 
Static int disp_sym_entry (Elif32_Sym x* Symychar x* Strtbl, int btitle) 


《 


char * p,temp[]=” " ,name[64] ,buf[16]; 

int ts; 

计 (btitle) { 

BrintE( ~------ 一 -一 -~-- 一 -~-- 一 -一 -一 --- 一 -------- 一 -一 一 一 --- 一 一 一 一 一 -一 一 \n") 
Brintf(” SYM_NRME VRLUE SIZE INFO OTHER SEC_IDX \n"); 
printf("” ” ------------------------------------------------- \nr) ， 


} 


让 〈(strtbl 8&S sym 一 盖 St_name){ 
P = (strtbl + SYm 一 盖 st_name); 
sprintf(namey," [(gsd)#ss]”,s 血 ~- >st_nane,p); 
许 (strlen(Cname) < strlen(temp)) 
strcat(name,S&temp[strlen(name)])? 


else 
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Pr 


mame[ strlen(temp)] = A0; 


Ta 
Ze 


pr3int 和 Cname) ; 入 
}else 起 
printf(" [gs 08x: no_name]" ,sm- >St_name); 软 
人 
printf(”0xg 08x" ,sym- >St_value); 由 
printf("”0x 负 08x " ,sym 一 St_size); 计 
t = Sym 一 全 st_info > 4; 本 
switch (t){ 起 
case STB_LOCRL :， sprintf(buf,":LC"); breaki 抱 
case STB_GLOBAL ，sprintt(buf,":GL") ，break; -了 
case STB_WERK “ :sprintf(buf，" :性 ");， break; ” 
default:， sprintf(buf，" :UN")， break; 人 

} 
261 


t = Sym 一 st_info & 0xf; 

Switch (七 ){ 
Case STT_NOTYPE ，strcat(buf，" :NTIBP  “); break; 
case STT_OBJECT : strcat(buf ， :DRTR " )， break; 


case STT_FUNC strcat(buf," :EUNC " ); break; 
case STT_SRECTION:， strcat(buf," :SECN "); breaky 
case STT_ FILER ，Sstrcat(buf," ;FILE ");y break; 


default，strcat(buf， "UN "”) break; 
} 
printf(”0xg 02xgs" ,sy 一 >st_infoy,buf)， 
printf(”0xg 02x “”,sSym- 盖 St_other); 
Printf(”0x 和 04x " ,sm 一 st_shndx); 
printf("N\n" ) ; 
Feturn 0; 


} 

小 结 : 

本 节 完 整地 讨论 了 ELEF 文件 的 格式 。ELF 文件 实际 上 是 源 程 序 文件 通过 编译 链接 脚本 
的 指示 ,由 各 种 编译 链接 工具 处 理 所 生 成 的 目标 文件 ,包含 可 执行 文件 。 本 节 通 过 具体 的 程序 
代码 ,加 深 读者 结合 对 程序 内 部 结构 ,链接 脚本 的 理解 。 

ELF 文件 格式 是 Loader( 程 序 装载 器 ) 实 用 程序 的 基础 ,动态 链接 库 装 和 人 及 其 符号 解析 的 
基础 ;也 是 构建 Boot - loader, 操作 系统 核心 的 重要 骨架 ;同时 ,深入 掌握 ELF 文件 格式 对 于 
内 核 调试 也 有 极 大 的 帮助 。 


13 。 和 


SN 生生 页 避让 和 


庶 入 式 系统 的 设计 思想 


岩 和 人 式 设 计 的 方法 在 前 面 的 章节 中 已 经 讲 得 很 多 ,本 篇 主要 介绍 笔者 在 散人 式 软件 开发 
工作 中 的 一 些 经 验 以 及 嵌入 式 软件 设 计 的 一 些 思想 。 虽 然 有 些 说 教 性 质 , 但 也 是 笔者 的 一 些 
心得 ,以 供 大 家 借鉴 和 参考 。 

方法 是 一 门 学 问 , 杰 得 微 电 子 的 总 裁 欧 阳 合 博士 就 常常 提 到 “Methodology”( 方 法 学 )。 
复杂 系统 的 设计 ,首先 是 要 有 思路 ,其 次 是 要 有 方法 。 只 有 寻求 到 正确 .并 能 有 效 解决 问题 的 
方法 ,任何 的 设计 与 开发 才 会 取得 卓有成效 的 结果 。 

方法 取决 于 一 个 人 的 经 验 和 思维 方式 ,创新 的 方法 更 是 与 一 个 人 的 思维 方式 密切 相关 。 

一 个 人 的 思想 并 不 是 什么 神秘 的 产物 ,平常 思考 问题 ,或 对 某 事 的 立场 、 观 点 ,都 是 一 个 人 的 思 
想 的 反映 。 典 人 式 软 件 的 设计 是 一 项 极其 复杂 的 工程 ,运用 正确 的 思路 ， 寻找 正确 解决 问题 的 
方法 是 至 关 重 要 的 。 

事实 上 ,讨论 思想 与 方法 已 经 超过 了 本 人 的 能 力 , 这 里 所 要 谈 到 的 嵌入 式 软件 设计 的 思想 
只 是 介绍 笔者 的 一 些 切身 感受 。 将 它 强 调 地 提出 来 ,目的 是 唤起 读者 的 注意 与 共 响 。 只 要 我 
们 在 设计 实践 中 心细 意 坚 .锐意 进取 ,就 会 变 成 一 把 锋利 的 尖刀 ,任何 问题 都 会 迎刃而解 ,就 能 
设计 出 非常 优秀 的 项 目 。 


13.1 _ 直截了当 的 思想 


和 和 计 款 二 于 放生 生生 


在 解决 一 些 数 学 难题 或 是 智力 题目 时 ,人 们 常常 讲究 “直接 思维 ”。 所 谓 “ 直 接 思维 ”是 依 
赖 于 一 个 人 对 于 某 个 专业 领域 的 深刻 理解 与 掌握 ,对 于 问题 的 解决 方法 有 一 种 直觉 的 思考 。 
这 种 直 党 的 思考 并 没有 严密 的 逻辑 性 ,因而 它 并 不 一 定 完 全 正确 ,但 是 却 可 以 为 解决 问题 提供 
可 能 的 途径 与 方法 .。“ 直 接 思 维 ” 是 智能 高 低 的 一 个 重要 体现 。 

笔者 在 这 里 所 要 谈 到 的 直截了当 的 思想 ,有 点 类 似 于 “直接 思维 ”, 但 又 有 所 不 同 。 由 于 谍 
人 式 系统 的 复杂 性 和 代码 的 庞大 , 它 要 求 开 发 人 员 对 于 自己 所 设计 的 范畴 有 深入 的 理解 与 掌 
握 , 弄 清楚 设计 边界 。 那 么 “直截了当 ”意思 就 是 说 设计 者 首先 应 该 看 到 终极 目标 ,然后 在 设计 
的 过 程 中 , 直 奔 目标 。 用 英文 “straightforward? 来 表达 这 个 意思 应 该 更 确切 一 点 。 

一 些 软件 工程 师 所 开发 的 程序 写 得 很 复杂 ,看 上 去 一 片 混乱 ,犹如 一 团 乱 售 。 相互 间 的 调 
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用 层次 关系 不 明确 。 举 个 例 说 ,有 一 位 工程 师 开 始 写 驱动 的 时 候 讲 ,他 写 的 init( ),open( )， 
read( ) ,write( ) 等 函数 都 实现 好 了 ,也 执行 对 了 ,可 就 是 不 能 正常 工作 。 为 什么 执行 对 了 还 
不 能 工作 呢 ? 答案 只 有 一 个 ,没有 执行 对 。 之 后 我 去 分 析 他 写 的 代码 ,发 现 根本 就 没有 操作 硬 
件 。 所 以 开发 者 认为 对 ,但 实现 是 没有 对 的 。 解 决 的 办 法 是 ,要 搞 清 楚 每 一 个 模块 ,每 一 个 函 
数 ,它们 的 目标 是 什么 ,要 达到 那些 目标 ,从 软件 和 硬件 上 需要 作 什么 样 的 操作 才能 实现 。 这 
就 是 我 这 里 要 谈 的 “直截了当 ”的 思想 。 

如 何 才能 做 到 “直截了当 ” 呢 ? 我 们 可 以 从 前 人 的 经 验 当中 得 到 一 些 借鉴 。 比 如 在 学 习 数 
据 结构 .操作 系统 原理 或 网 络 原 理 的 时 候 , 对 于 一 段 复杂 的 描述 与 讲解 ,往往 让 我 们 觉得 很 玄 
妙 。 如 果 要 让 我 们 自己 去 实现 , 那 简直 是 无 从 着 手 , 但 是 一 看 别人 对 于 数据 结构 的 定义 以 及 三 
两 行 的 代码 实现 ,就 会 让 我 们 锁 然 大 悟 , 昔 塞 顿 开 ,这 就 是 “直截了当 ”。 

写 那些 系统 原理 、 网 络 原理 实现 的 人 可 谓 专家 或 是 大 师 , 他 科 对 于 所 要 解决 的 问题 理解 非 
常 深刻 。 因 而 在 数据 结构 的 描述 ,算法 的 实现 上 就 可 以 做 到 直 奔 主题 。 数 据 结 构 中 的 变量 定 
义 绝 不 会 多 一 个 ,也 不 会 少 一 个 ,代码 实现 上 ,让 人 感觉 也 是 不 会 多 一 行 ,也 不 会 少 一 行 ,完美 
之 至 。 

理解 了 这 个 目标 ,然后 再 来 看 应 该 如 何 实现 这 一 目标 吧 。 

首先 , 它 要 求 我 们 对 于 所 要 要 解决 的 问题 ,能 够 深入 理解 它 的 实质 。 这 句 话说 来 轻松 ,但 
真正 要 做 到 却 不 是 一 件 简单 的 事情 。 一 个 设备 往往 与 一 个 或 多 个 协议 相关 联 。 例 如 一 个 声卡 
设备 , 它 往 往 与 AC97, 了 下 S 等 协议 相关 联 ,在 程序 设计 的 时 候 还 得 要 理解 OSS 之 类 的 设计 模 
型 。 面 对 一 大 杰 的 协议 ,程序 员 如 何 能 够 抓 住 要 领 ,理解 协议 所 反映 的 实质 内 容 ,这 只 有 靠 刻 
苦 的 学 习 才 能 达到 。 

如 果 一 个 程序 员 只 是 把 自己 的 要 求 定 位 于 了 解 大 概 , 不 求 甚 解 上 ,那么 在 设计 的 过 程 中 就 
会 屡 犯 错误 ,无 法 做 到 直 奔 问题 。 

初学 者 由 于 没有 相关 的 行业 经 验 ,对 于 一 些 专业 术语 缺乏 背景 知识 ,因而 无 法 正确 理解 协 
议 的 内 容 ,而 且 往往 是 看 了 后 面 委 了 前 面 , 或 者 是 抓 不 住 与 设计 相关 的 实质 内 容 , 而 只 注意 到 
了 那些 特性 ,或 是 应 用 领域 的 介绍 ,这些 都 是 对 协议 理解 不 深 的 表现 。 

对 一 个 协议 的 深刻 理解 ,表现 在 两 个 方面 

一 是 可 以 用 简短 的 话 把 一 个 协议 全 面 描述 出 来 。 我 们 可 以 从 一 些 协 议 人 门 简介 中 得 到 启 
示 。 换 句 通俗 的 话 就 是 说 “要 把 厚 书 读 薄 ”。 

二 是 用 简短 的 话 讲述 协议 的 关键 点 而 忽略 那些 描述 性 .介绍 性 的 内 容 。 直 截 了 当 还 体现 
在 表达 能 力 上 , 它 要 求 我 们 能 清楚 描述 自己 的 问题 , 讲 清楚 上 下 文 , 讲 清楚 问题 的 实质 。 

理解 了 协议 ,理解 了 硬件 行为 ,理解 了 设计 的 要 求 以 及 软件 需要 解决 的 问题 , 才 是 做 到 “ 直 
截 了 当 ” 的 第 一 步 , 也 就 是 说 已 经 做 到 了 设计 目标 明确 ,心中 有 数 。 接 下 来 的 问题 是 如 何 去 实 
现 ,在 实现 上 如 何 做 到 “直截了当 ”。 

程序 是 软件 设计 的 表现 形式 ,要 在 程序 实现 上 做 到 “直截了当 ”, 才 是 最 终 的 目的 。 所 以 这 
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方面 又 要 求 程序 员 具 有 深厚 的 程序 设计 能 力 以 及 解决 问题 的 能 力 。 

如 何在 程序 设计 中 做 到 结构 清晰 ,有 的 放 矢 ,去除 程 序 设计 中 在 空间 和 时 间 上 的 元 余 , 同 
样 需要 程序 员 有 高 度 的 敬业 精神 ,需要 在 工作 实践 中 吸取 他 人 长 处 ,对 自己 的 设计 精益 求 精 ， 
从 而 不 断 提 高 自己 的 程序 设计 能 力 。 

为 了 更 清楚 说 明 “ 直 截 了 当 ” 的 思想 , 举 几 个 简单 的 例子 来 说 明 不 同 的 程序 设计 思路 ,看 看 
你 属于 哪 一 类 ? 

第 一 类 程序 员 是 不 知道 该 从 哪里 开始 写 ? 或 者 是 写 了 很 长 的 程序 后 ,在 中 途 不 知 怎么 继 
续 往 下 写 。 简单 地 说 ,不 知道 自己 写 的 程序 在 做 什么 ,目的 是 什么 ? 这 类 人 可 能 对 程序 没有 太 
多 的 灵感 ! 如 果 没 有 足够 的 亲 力 和 信念 的 话 , 建 议 还 是 转行 比较 好 。 

第 二 类 程序 员 可 能 从 main( ) 开 始 吧 ! 当 他 想到 某 个 功能 可 以 被 独立 出 来 作为 一 个 函数 
模块 时 ,他 会 设计 一 个 新 的 函数 。 当 一 个 函数 需要 保存 一 些 状 态 时 ,他 会 想到 去 设置 一 个 全 局 
变量 。 

第 三 类 程序 员 可 能 是 先 去 建立 需要 操作 的 数据 结构 ,然后 再 来 建立 需要 对 数据 操作 的 方 
法 (函数 )。 

容易 想到 ,值得 推荐 的 做 法 是 数据 驱动 的 思想 。 

一 些 程序 员 在 设计 中 也 会 想到 写 各 种 各 样 的 过 程 函 数 , 写 各 种 各 样 的 接口 。 但 是 接口 函 
数 与 其 他 模块 的 层次 关系 没有 想 好 ,模块 内 部 的 相互 关系 也 纠缠 不 清楚 ,其 结果 是 写 出 来 的 函 
数 没有 其 他 模块 来 调用 ,或 者 不 知道 如 何 调用 。 模 块 内 部 以 及 模块 之 间 的 相互 纠缠 导致 接口 
不 清晰 ,任务 不 明确 ,结果 是 程序 无 法 按 预定 的 目标 去 实现 特定 的 任务 ,或 者 是 一 个 模块 的 目 
标 任务 都 没有 明确 想 清 楚 。 这 些 都 是 无 法 “直截了当 ”设计 程序 的 反例 。 

归纳 一 下 ,要 做 到 “直截了当 ?地 设计 程序 模块 ,首先 需要 深刻 理解 与 设计 相关 的 一 些 专业 
技术 ,例如 一 些 书 籍 中 所 讲述 的 原理 ,或 是 一 些 协 议 标 准 中 所 定义 的 软件 和 硬件 行为 规范 ;其 
次 需要 在 软件 设计 中 正确 定义 明确 的 接口 ,模块 内 部 的 设计 任务 ;第 三 则 是 反应 在 程序 设计 功 
底 上 ,能够 “直截了当 ?地 把 设计 任务 用 简明 ,高 效 的 代码 表示 出 来 。 

一 些 程序 员 在 设计 一 些 模块 时 ,经 常 遇 到 编写 了 一 些 函 数 , 却 从 来 没有 使 用 过 ;或 本 来 是 
简单 的 问题 , 却 把 它 复杂 化 了 。 这 些 都 是 没有 深入 理 解 问题 的 实质 ,没有 很 好 地 掌控 驾驭 自己 
的 设计 ,不 能 进行 直截了当 设计 的 反例 。 

为 此 ,再 看 一 个 例子 : 

问题 实现 一 个 函数 ,在 一 个 输入 字符 串 中 ,查找 最 后 一 个 指定 的 子 串 。 如 果 找 到 ,返回 
这 个 子 串 的 起 始 地 址 ;所 有 其 他 情形 ,返回 空 NULL)。?” 

看 看 某 个 程序 员 的 实现 ， 

int n=0; 

Struct Stringfind 


{ 
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char x* String_f; 
long num; 
Struct stringfind xDext; 


) 


Struct Stringfind xx head; 


Struct Strjingfind x* P1，x P2; 


Struct Stringfind x* creat(〈volid) 
{ 
pl = B2 = (stringfind x* ) malloc(sizeof(Struct stringfind)); 
scanf (”% s， 外 1d",&pl - >string_f,&pl - 盖 num); 
head = null; 
while (p1 一 盖 num 1=0) 
《 


nn=n+l; 
if(Cn== 1) 
bead = pl; 
else 
p2- 二 next = p1; 
p2 = pl; 


pB1 = (struct stringfind *x* )malloc(sizeof(struct stringfind)); 
scanf(〔(" 外 s，% 1d",&pl -~ 盖 string_f,S&pl- 盖 Dum); 
} 
pP2- >>next = NULD; 
return (head) ; 
} 


Struct Stringfind x* find(Cchar x* Sub_string) 
《 


Struct Stringfind xx p1，x p2y 
1 (head == NULL) return NULL; ， 


pP1 = head; 
while(! (strcmp(sub_stringy,pl -一 string f) && pl - >>next 1 = NULL) 
{ 


p2 = pl; pl1=Ppli- 之 next; 
} 
if(pP1 ! 


NULL) 
Feturn P1; 
else 
return NULL; 
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点 评 :本 例 中 ,有 几 点 是 比较 费解 的 。 

人 申 Creat() 函数 没有 看 到 被 使 用 。 

@ 函数 .Creat() 中 使 用 了 大 量 的 malloc, 没 有 见 任何 地 方 被 释放 。 

这 种 只 管 分 配 而 不 管 释放 的 做 法 跟 一 个 家 庭 主 妇 只 喜欢 做 菜 而 不 负责 洗 碗 、 不 喜欢 收拾 
是 一 样 的 道理 。 试 想 , 如 果 这 个 家 庭 主妇 每 次 都 备料 ,炒菜 ,然后 将 剩 下 来 的 残 料 ,以 及 用 过 的 
碗 答 到 处 乱 扔 ,天 长 日 久 ,可 以 想见 再 多 的 碗 簧 .再 大 的 厨房 也 是 不 够 用 的 。 系 统 中 的 内 存 , 以 
及 其 他 一 些 资 源 的 管理 与 之 非常 相似 ,一 旦 使 用 了 ,就 得 负责 清理 ,随时 谭 记 释放 。 只 有 这 样 ， 
才能 保证 日 复 一 日 ,年 复 一 年 地 过 去 ,每 天 都 可 以 做 出 于 净 、 卫 生 和 可 口 的 饭菜 ,同时 也 能 保证 
整个 厨房 整洁 .于 净 ,甚至 赏心悦目 。 

另 一 方面 ,如 果 一 个 大 的 数组 在 几乎 整个 进程 的 生存 周期 都 存在 ,那么 使 用 静态 分 配 与 动 
态 分 配 ,对 于 系统 开销 而 言 ,是 没什么 区 别 的 。 一 旦 进程 停止 工作 ,为 它 所 分 配 的 资源 ,包括 静 
态 分 配 的 内 存 将 全 部 被 释放 。 而 对 于 小 的 内 存 , 有 限 次 的 分 配 ,对 于 系统 开销 没有 实质 的 影响 
的 话 , 还 是 建议 使 用 静态 分 配 。 除 了 循环 分 配 ,分 配 的 长 度 只 有 在 运行 的 时 候 才 能 确定 的 情 
形 , 才 使 用 动态 分 配 。 

小 结 : 

条 件 容 许 的 情况 ,尽量 使 用 静态 分 配 来 代替 动态 分 配 ;使 用 了 动态 分 配 ,要 随时 廊 记 释放 。 

回 到 本 例 中 所 讨论 的 话题 ,这 个 设计 题目 应 当 是 相当 简单 的 ,就 是 一 个 简单 的 字符 串 操 作 
的 函数 。 但 设计 者 却 将 问题 复杂 化 得 有 一 点 看 不 懂 , 为 什么 要 设计 一 个 Creat() 枯 数 ? 设计 了 
还 不 见 使 用 。 为 什么 要 设计 一 个 复杂 的 数据 结构 ? 

仔细 分 析 一 下 ,大 概 是 设计 者 对 于 问题 产生 了 歧义 ,把 输入 串 想像 成 需要 从 键盘 终端 接收 
大 量 的 用 户 输入 , 而 将 它们 保存 到 一 个 结构 队列 中 。Creat() 就 用 于 创建 这 个 输入 队列 。 这 个 
结果 让 人 有 点 啼笑 皆 非 。 

如 果 能 写 出 一 个 原型 : 


char x* find_last_substring (char x* inp_stry,char x* substr); 


问题 就 可 能 迎刃而解 。 

假如 设计 者 真希 望 设计 一 个 复杂 的 模块 ,那么 也 应 该 有 一 个 完整 的 框架 ,加 上 必要 的 注释 
说 明 。 例 如 : 

Creat() ;建立 输入 字符 串 队 列 。 

Release() ;释放 清除 Creat() 过 程 所 使 用 的 内 存 资源 。 

Find(); 从 输入 字符 串 队 列 中 查找 所 要 找 的 子 串 。 

从 这 个 例子 可 以 看 出 ,直截了当 的 思路 要 求 我 们 首先 要 清楚 理解 问题 ,准确 理解 问题 是 关 
键 。 其 次 是 要 在 解决 问题 (程序 设计 ) 的 时 候 , 清楚、 规范 , 直 奔 主题 ,把 握 全 局 。 理解 协议 文 
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档 、 模 块 的 实现 和 工程 项 目的 实施 ,正确 理解 是 决定 性 的 一 环 。 只 有 正确 理解 了 问题 ,并 对 证 
下 药 解决 问题 ,才能 避免 少 走 弯路 ,避免 将 简单 的 问题 复杂 化 。 


13.2 层次 化 的 思想 


程序 设计 中 讲求 模块 化 的 设计 。 由 于 操作 系统 是 一 个 高 度 复 杂 ,非常 旋 大 的 系统 ,所 以 时 
人 式 系统 软件 不 但 讲求 模块 化 ,而 且 还 要 讲求 设计 的 层次 化 。 由 于 操作 系统 的 终极 目标 是 要 
提供 给 应 用 程序 一 个 通用 .功能 丰富 的 运行 平台 ,而 它 所 面 对 的 对 象 是 基于 系统 本 身 赖 以 运行 
的 硬件 平台 。 因 此 大 体 上 来 看 ,一 个 系统 分 为 3 个 层次 ,其 中 ,最 上 层 是 应 用 程序 ,最 底层 是 硬 
件 平 台 , 中 间 层 是 操作 系统 。 操 作 系 统 本 身 维护 着 复杂 的 内 部 对 象 , 即 内 部 数据 结构 ,以 及 一 
些 内 部 的 内 核对 象 , 例 如 :进程 信号 量 和 内 存 管理 器 等 。 

除了 这 种 比较 粗 旷 的 分 层 结构 ,操作 系统 内 部 也 区 分 不 同 的 层次 ,我 们 在 “1.1. 3 骨 入 式 
软件 的 分 层 结构 ?小 节 中 ,已 经 讨论 了 这 种 层次 结构 , 除 此 之 后 ,对 于 处 在 操作 系统 底层 的 驱动 
程序 ,还 可 以 进一步 分 层 , 例 如 :在 WinCE 中 把 那些 与 硬件 无 关 的 统一 的 程序 实现 抽象 出 来 ， 
作为 一 个 驱动 中 间 层 ,而 把 那些 与 特定 硬件 相关 的 代码 与 实现 分 离 出 来 ,作为 驱动 的 物理 实 
现 层 。 

在 应 用 程序 中 ,也 使 用 分 层 结构 ,例如 数字 电视 开发 中 ,广泛 采用 中 间 件 的 结构 , 即 是 把 与 
数字 电视 (例如 DVB,ATSC)? 节 目 信 息 系 统 的 管理 提取 出 来 ,作为 一 个 统一 的 层次 ,从 而 上 层 
应 用 只 关心 界面 的 实现 以 及 程序 系统 的 整体 运作 ,使 得 上 层 应 用 的 设计 可 以 高 度 面 向 对 象 化 。 

1. 分 层 设计 的 优点 

分 层 结构 的 重大 优点 有 两 个 : 

@ 层次 结构 清楚 ,调用 关系 明确 ,层次 间接 口 定 义 分 明 。 

@ 每 个 层次 的 软件 实现 者 可 以 只 关注 自己 所 开发 模块 的 实现 ,从 而 形成 了 项 目的 协作 
开发 。 

使 用 分 层 结构 ,其 基本 要 求 是 下 层 为 邻近 的 上 层 提 供 服务 ,当然 ,必要 的 时 候 , 上 层 也 会 为 
下 层 提 供 回 调 函 数 。 层 次 之 间 的 调用 都 是 邻近 的 ,理论 上 说 ,禁止 跨越 层次 的 调用 。 即 是 说 ， 
最 上 层 不 能 跨 过 与 它 邻 近 的 第 二 层 而 直接 调用 第 三 层 或 是 第 四 层 所 提供 的 服务 。 

2. 如 何 实现 软件 的 层次 化 

(1t) 层次 以 及 接口 定义 

为 了 实现 软件 的 层次 化 设计 ,最 基本 也 是 最 重要 的 就 是 接口 的 定义 。 接 口 的 定义 必须 以 
显示 的 、 完 整 的 文档 描述 出 来 ,这 是 一 个 大 型 工程 项 目 所 必须 的 ,而 这 正 恰 恰 是 一 些 公 司 或 是 
一 些 软件 开发 人 员 所 忽略 的 。 

接口 一 旦 定义 ,就 必须 相对 稳定 ,不 能 轻易 改动 。 接 口 的 变动 需 由 专门 的 机 构 以 及 相应 的 
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项 目 会 议 讨 论 通 过 。 

《2) 模块 的 定义 

在 一 个 软件 层次 中 ,还 要 有 彼此 关联 的 各 个 模块 。 一 般 地 ,模块 间 相 互 关 系 越 小 ,模块 越 
独立 ,代码 复 用 性 以 及 代码 的 效率 都 会 得 到 提升 。 另 一 方面 ,同一 层次 中 的 各 个 模块 还 要 注重 
协调 ,相互 间 有 些 同 层次 的 调用 。 如 何 把 相互 间 的 牵连 做 得 最 小 ,如 何 把 模块 间 的 协作 性 提升 
到 最 高 ,这 要 求 程 序 设计 员 有 较 高 的 专业 知识 和 业务 设计 能 力 。 。 

除了 层次 之 间 的 接口 定义 外 ,模块 之 间 的 接口 定义 也 相当 重要 。 所 以 一 旦 大 的 项 目 分 层 
下 来 ,同一 个 层次 之 中 的 小 的 项 目 也 必须 做 到 很 好 的 分 离 ,确定 明确 的 模块 的 接口 。 

〈3) 模块 的 实现 

一 且 接 口 定 义 好 ,特定 层次 中 特定 模块 的 设计 者 就 要 专注 于 自己 的 实现 。 

所 谓 “ 专 注 ”, 就 是 说 ,模块 的 设计 者 只 全 力 实 现 自 己 的 模块 ,而 “忘记 ”其 他 的 模块 与 任务 。 
“专注 要求" 博 ”, 而 且 “ 深 ”。 

模块 的 实现 首先 要 深刻 地 理解 这 个 模块 所 要 实现 的 任务 和 所 要 达到 的 目标 。 这 要 求 设 计 
人 员 对 于 所 设计 的 对 象 进行 深入 钻研 ,深入 理解 设计 所 要 处 理 的 对 象 ,中 间 所 涉及 的 过 程 和 最 
终 实现 的 目标 。 

这 里 所 提 到 的 “ 博 ” 就 是 说 设计 者 不 仅仅 着 眼 于 解决 应 用 所 遇 到 的 问题 和 需求 ,而 且 应 该 
就 现 有 的 需求 举一反三 ,从 特例 推广 到 一 般 。 从 广泛 的 、 一 般 的 需求 和 人手, 这 样 定义 的 接口 才 
会 在 未 来 "相当 ?长 一 段 时间 内 满足 设计 的 需求 ,而 不 至 于 在 所 设计 的 模块 软件 还 没有 被 有 效 
地 利用 之 前 就 已 经 过 时 ,需要 升级 更 改 。 

“ 深 ? 在 于 理解 的 深入 ,实现 的 透彻 。 

“忘记 ”意味 着 专注 于 一 般 的 需求 ,而 忘记 现 有 的 特定 需求 。 

举 个 例子 具体 地 说 ,例如 一 个 驱动 的 设计 或 是 一 个 中 间 模 块 , 它 的 用 途 只 是 一 个 带 有 信息 
处 理 的 通道 , 它 不 应 该 做 任何 额外 的 事情 ,特别 是 不 应 该 做 这 个 模块 不 需要 实现 的 事情 。 只 有 
这 样 ,才能 达到 模块 化 ,才能 实现 层次 化 。 

再 举 个 例子 ,例如 一 个 驱动 , 它 并 不 像 应 用 程序 那样 完成 具体 的 任务 ,只 是 根据 用 户 的 请 
求 去 完成 特定 的 功能 。 就 好 比 一 个 处 理 机 , 它 不 应 该 记 住 一 些 不 必要 的 事情 。 说 得 更 清楚 一 
点 , 那 就 是 一 个 设计 的 打开 操作 只 是 执行 与 打开 操作 相关 的 软件 与 硬件 的 初始 化 操作 ;而 一 个 
数据 传输 ,只 关心 数据 传输 ( 读 或 写 ), 而 不 应 该 去 关心 .去 解析 数据 中 特定 的 内 容 以 及 售 义 。 
可 以 把 驱动 想像 成 一 个 通道 , 它 并 不 做 具体 实际 的 事情 ,而 是 把 具体 的 控制 交 给 上 层 应 用 去 
完成 。 

只 借助 于 现 有 的 需求 ,又 要 忘记 现 有 的 特定 需求 ,不 是 为 了 解决 一 个 特定 问题 而 设计 ,这 
样 设 计 的 驱动 才 可 以 通用 。 其 他 模块 的 设计 ,其 思路 亦 必 须 如 此 。 
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着 村 让 让 全 下 表 下 计生 站 和 和 守 各 生生 下 十 扩 半生 生生 让 


对 于 一 个 复杂 的 系统 ,上 和 手 是 非常 重要 的 ,一 个 不 会 游泳 的 人 ,如 果 把 他 扔 到 大 海里 ,答案 
只 有 一 个 。 如 果 能 从 一 些 简单 的 项 目 人 手 , 就 可 以 慢 慢 地 融和 人 到 了 大 的 系统 中 。 当 然 不 是 每 
个 人 都 有 简单 项 目的 机 会 ,你 的 项 目 经 理 也 未 必 那 么 热情 或 是 细心 ,给 你 安排 简单 的 项 目 。 遇 
到 这 种 情况 ,就 要 善于 把 一 个 复杂 的 项 目 简单 化 ,虚心 向 一 些 经 验 丰富 的 工程 师 请 教 。 先 措 一 
个 简单 的 框架 ,或 是 先 从 一 些 简单 的 验证 入 手 。 

项 目的 设计 也 允许 循序 渐进 。 由 于 经 验 不 足 , 很 难 一 下 子 就 把 一 个 接口 做 得 很 完善 ,程序 
的 效率 很 难 一 下 子 就 满足 需求 。 同 样 的 ,这 种 情况 下 ,也 需要 一 步 一 步 把 项 目 做 完善 。 在 设计 
的 过 程 中 ,可 以 发 现 一 些 新 的 问题 ,找到 一 些 新 的 思路 ,一 段 时 间 之 后 ,对 过 去 的 设计 做 一 些 整 
理 , 必 要 的 时 候 , 也 可 能 推翻 以 前 的 设计 重新 开始 。 这 些 都 是 循序 渐进 的 例子 。 

虽然 循序 渐进 并 不 等 于 反复 ,但 一 些 时 候 反复 是 免不了 的 ,因为 人 非 圣 贤 ,重要 的 是 ,如 何 
减少 不 必要 的 反复 ,如 何在 每 次 的 反复 过 程 中 ,有 一 个 较 大 的 提高 和 完善 。 


程序 的 设计 也 是 一 个 不 断 地 优化 、 不 断 改进 ` 不 断 总 结 ` 不 断 创新 和 不 断 提 高 的 过 程 。 学 、 


习 是 永 无 止境 的 ,设计 亦 然 如 此 。 


人 


一 个 只 懂得 游泳 理论 的 人 ,不 经 过 实践 , 掉 进 深水 里 ,终归 还 是 会 被 淹 死 。 同 样 , 只 看 教科 
书 , 只 学 习 理 论 , 不 从 事实 际 的 项 目 开 发 ,其 收效 是 很 微薄 的 。 因 此 ,在 学 习 的 过 程 中 ,要 勇于 
参与 到 项 目 开发 当中 去 ,新 的 项 目 到 来 时 ,也 不 要 牛 轻 怕 重 。 要 敢于 吃苦 ,敢于 在 实践 中 学 习 ， 
实践 才 是 最 好 的 老师 。 

当然 ,在 敢于 实践 的 同时 ,还 必须 把 每 一 个 项 目 都 做 得 很 完善 .很 深信。 其 一 ,只 有 把 项 目 
做 好 ,才能 有 机 会 开发 新 的 项 目 , 别 人 才 会 信任 你 ,把 新 的 任务 交 给 你 。 其 二 ,只 有 把 项 目 做 深 
人 ,才能 触 类 旁 通 ,掌握 了 设计 的 实质 ,其 他 同类 项 目 做 起 来 才能 得 心 应 手 。 如 果 每 一 样 开发 
都 停留 在 表面 ,只 知道 皮毛 ,只 求 泛 泛 地 了 解 , 只 求学 一 把 ,就 换 一 个 项 目 , 东 打 一 枪 , 西 瞄 一 
把 ,最 终 只 是 假 把 式 ,消灭 不 了 敌人 ,也 成 不 了 正果 。 所 以 ,实践 必须 深入 。 

另 一 方面 ,在 实践 的 同时 ,还 必须 结合 理论 的 学 习 , 学 习 前 人 的 经 验 , 学 习 系 统 的 理论 知 
识 。 只 有 实践 与 理论 相 结合 ,才能 提高 自己 的 专业 能 力 , 有 效 地 提高 自己 的 设计 水 乎 。 

在 勇于 实践 的 过 程 中 ,应 该 学 会 虚心 向 一 些 经 验 丰 富 的 工程 师 请 教 。 努 力 寻求 各 种 资源 ， 
借鉴 别人 的 思想 和 方法 。 

在 勇于 实践 的 过 程 中 ,还 必须 不 断 地 给 自己 定位 更 高 的 目标 ,严格 要 求 自己 ,不 断 提 高 自 
己 的 设计 能 力 。 
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实践 过 程 中 ,困难 甚至 于 挫折 都 是 免不了 的 。 在 困难 面前 要 敢于 迎 着 困难 上 ,寻求 各 种 解 
决 问题 的 办 法 。 失 败 后 再 重 来 ,不 能 有 任何 苦难 的 情绪 ,必须 具备 不 达 目 的 不 罢休 的 战斗 精 
神 。 从 而 要 求 设 计 人 员 在 实践 中 不 断 的 锻炼 自己 的 意志 


13.5 团队 协作 意识 


SN 


最 后 ， 谈 谈 团队 合作 的 意识 。 团队 协作 在 任何 一 项 事情 中 都 很 重要 ,在 软件 开发 中 更 是 如 

。 系 统 越 来 越 复 杂 ,质量 .性 能 和 功能 要 求 越 来 越 多 , 单 靠 个 人 英雄 主义 已 经 没有 可 能 去 完 
个 稍微 大 一 点 的 项 目 。 一 个 人 的 知识 和 能 力 是 非常 非常 有 限 的 ,所 以 必须 借助 于 团队 的 
力量 。 

“十 根 筷子 ”的 原理 大 家 都 很 清楚 。 在 团队 中 ,互相 学 习 , 互 相 进步 。 如 果 十 个 人 ,每 人 学 
一 小 块 , 加 起 来 就 有 十 小 块 ,如 果 大 家 共同 分 享 , 每 个 人 就 获得 了 十 倍 的 收效 。 

良好 的 团队 永远 是 公司 发 展 的 基石 和 个 人 成 长 的 先导 。 最 为 难忘 的 工作 经 历 是 我 在 深圳 
联想 QDI 分 公司 从 事 BIOS 设计 期 间 , 团 队 给 我 的 深刻 影响 。 在 我 刚 走出 校门 的 时 刻 , 就 在 那 
里 不 但 有 幸 接触 到 Intel ITA32 的 核心 技术 一 -AWARD BIOS 汇编 源 代 码 , 更 重要 的 是 置身 
于 一 个 优秀 .无 私 的 开发 团队 。 公 司 对 我 们 新 员工 组 织 了 近 两 个 月 的 知识 技能 培训 ,在 培训 会 
上 ,部 门 经 理 鼓励 新 员工 “长 江 后 浪 推 前 浪 ”,“ 如 果 后 一 代 不 超过 我 们 ,我 们 的 事业 就 得 不 到 发 ， 
展 和 进步 ”的 言语 深 深 地 震 握 了 我 。 另 一 方面 ,培训 经 理 严谨 的 研发 精神 ,不 懂 就 是 不 慌 的 学 
术 作 风 给 我 以 后 的 研发 工作 带 来 了 深刻 的 影响 。 


13.6 大胆 尝试 与 积极 创新 


| 和 


能 人 式 软件 设计 中 ,常常 会 面临 很 多 新 的 课题 ,在 开发 过 程 中 ,也 会 遇 到 一 些 新 的 问题 ,而 
周围 的 同事 又 没有 现存 的 方法 。 遇 到 这 种 情况 ,必须 自己 想 办 法 ,尝试 一 些 可 能 解决 问题 的 办 
法 ,最 终 创 造 出 新 的 方法 。 

大 胆 尝试 ,勇于 创新 ,在 戏 人 式 软件 开发 中 尤为 重要 

其 一 ,系统 很 复杂 ,涉及 庞大 的 操作 系统 ,涉及 复杂 的 编译 系统 ， 涉及 繁多 的 协议 规范 ， 涉 
及 各 种 各 样 的 应 用 软件 .开源 代码 、 网 络 资源 和 各 种 各 样 的 工具 ,一 个 人 没 办 法 在 需要 某 些 知 
识 的 时 候 , 手 边 就 恰好 有 这 项 资源 。 

其 二 ,许多 新 的 问题 ,没有 现存 的 答案 。 或 者 就 项 目的 需求 ,还 没有 类 似 的 解决 办 法 。 

无 论 是 不 知道 ,还 是 没有 类 似 的 方法 ,都 要 求 我 们 不 能 坐 以 待 毙 ,必须 积极 寻求 方法 ,解决 
问题 。 

比如 说 ,在 移植 软件 的 时 候 , 系 统 中 没有 这 一 方法 ,或 者 是 由 操作 系统 实现 的 ,而 这 个 系统 
中 没有 ,或 者 是 实现 的 方法 不 匹配 。 遇 到 这 种 没有 现成 方法 的 情况 ,直接 的 办 法 就 是 尝试 用 各 
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种 各 样 的 方法 去 努力 实现 它 。 

之 所 以 提出 大 胆 尝试 这 一 思想 ,是 因为 一 些 设 计 人 员 对 于 系统 程序 有 一 种 神秘 感 , 或 是 有 
一 种 依赖 性 。 他 们 认为 那些 应 该 是 操作 系统 去 做 的 ,而 操作 系统 又 很 复杂 、 很 神秘 ,似乎 距 已 
千里 ,高 不 可 攀 。 这 些 想法 都 是 错误 的 。 

童话 “小 马 过 河 ” 的 教训 值得 我 们 很 好 地 学 习 。 骨 入 式 软件 设计 的 范畴 本 就 是 系统 程序 的 
一 部 分 。 虽 然 作 为 一 个 项 目 团队 ,不 能 从 头 设计 一 个 完整 的 系统 ,但 是 我 们 在 某 一 部 分 或 在 某 
一 个 特定 的 问题 上 是 完全 有 能 力 `\ 有 义务 去 实现 它们 的 。 而 且 对 于 操作 系统 中 的 某 些 实现 ,还 
可 以 针对 自己 的 应 用 平台 做 一 些 优化 的 工作 。 

世上 本 没有 路 , 走 的 人 多 了 , 便 成 了 路 。 只 有 学 会 自己 走路 ,不 断 创 新 , 才 是 最 好 的 解决 方 
法 。 在 嵌入 式 设 计 的 具体 问题 之 中 ,永远 没有 一 种 现成 的 方法 。 未 知 的 问题 很 多 , 遇 到 问题 时 
应 该 想 办 法 去 解决 。 

只 有 敢于 大 胆 尝试 ,破除 对 系统 的 神秘 ,消除 对 旁人 的 信赖 心理 ,才能 使 自己 的 设计 生涯 
走 得 更 远 , 走 得 更 有 意义 。 


结束 语 


全 书 对 虹 人 式 软 件 设计 ,特别 是 系统 软件 所 需要 的 各 种 基础 知识 .基本 技能 作 了 系统 的 分 
析 讲 解 。 深 入 讨论 了 驱动 的 设计 模型 和 BSP/OAL 开发 的 核心 组 件 元 素 。 书 中 还 提供 了 大 量 
编程 实例 ,从 而 为 通 和 人 式 软件 爱好 者 提供 了 全 面 的 学 习 素 材 。 

从 选材 和 编排 上 ,本 书 首先 介绍 了 艇 人 式 软件 开发 所 必 备 的 基础 与 方法 方面 的 知识 ,然后 
讲解 如 何 着 手 从 头 开始 编写 系统 软件 ,再 深入 到 系统 软件 的 各 个 重要 方面 ,到 进一步 讲解 如 何 
建立 编译 脚本 创建 复杂 的 内 核 映 射 , 最 后 深入 讨论 程序 的 内 结构 及 可 执行 文件 的 格式 。 内 容 
由 浅 入 深 , 循 序 渐 进 , 知 识 覆 盖 面 非常 广泛 ,讨论 深刻 ,所 探讨 的 内 容 都 是 与 苦 人 式 软件 项 目 开 
发 息息相关 的 实质 内 容 。 

书 中 采取 了 理论 .实践 和 教学 相 结合 的 三 位 一 体 的 方式 ,体现 了 本 书 的 实用 性 。 同 时 与 读 
者 共享 了 笔者 在 实际 项 目 开 发 中 大 量 的 经 验 技巧 ,从 而 增添 了 本 书 对 骨 人 式 软件 设计 学 习 和 
实践 开发 的 重要 指导 性 。 

本 书 是 一 个 引子 ,就 像 一 个 导游 图 ,为 游客 指引 了 一 条 通 往 美妙 风景 点 的 道路 。 然 而 要 达 
到 成 功 的 顶点 , 却 需要 经 过 艰苦 的 践 涉 。 旅 途 是 艰辛 的 ,也 是 愉快 的 ! 有 挑战 ,也 有 跑 然 开朗 
和 轰 驭 工作 的 乐趣 ! 
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内 容 简 介 
本 书 从 教学 的 角度 出 发 ， 全 面 讨论 了 嵌入 式 软件 设计 的 思想 
1 与 方法 。 在 编排 上 循序 渐进 ， 从 基础 准备 ， 到 驱动 模型 ， 再 深入 
到 整个 系统 及 系统 的 构建 。 在 讲解 上 通过 建立 模型 来 帮助 读者 系 
'1 统 掌握 底 入 式 软件 设计 的 普遍 原理 与 编程 接口 。 内 容 包 括 : 高 
5 1 茹 :稳定 和 规范 的 程序 基础 ， 多 任务 环境 ，I/O 系 统 的 内 部 结构 ， ， 
驱动 模型 ， BSP 设计 要 素 ， 镀 入 式 软件 设计 的 经 验 技巧 ; 在 硬件 ; 
10( 居 各 方面 讨论 了 总 线 与 设备 的 模型 ， 基 于 MIPS 和 ARM SoC 在 多 个 ; 
if 系统 平台 VxWorks，Linux 及 WinCE 下 的 系统 资源 的 操控 。 


; 本 书 可 作为 在 校 学 生 学 习 赃 入 式 软件 设计 原理 的 教学 参考 用 
7 9 书 ， 也 可 作为 内 入 式 软件 开发 工程 人 员 深入 掌握 系统 软件 设计 的 | 
， 指南 ， 以 及 底 入 式 软件 培训 的 参考 教材 。 


| 张 邦 术 ，1999 年 毕业 于 电子 科技 大 学 ， 先 后 在 联想 、 泰 易 、 
591 各 开 和 秦 克 公司 从 事 近 10 年 嵌入 式 软件 及 系统 软件 的 研发 工作 ， 
在 VxWorks，Linux 和 WinCE 系 统 平台 上 的 开发 ， 以 及 在 音 / 视 频 、 


人 移动 媒体 、 测 试 仪器 等 领域 具有 丰富 的 设计 经 验 ， 在 软件 团队 的 
10( 组 建 `) 培训 和 项 目 管理 等 方面 积累 了 大 量 经 验 。 
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